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数据 库 管 理 系 统 〈 原 书 第 3 版 ) 


对 于 管理 和 信息 技术 的 专业 人 员 来 说 ,数据 库 是 最 重要 和 最 实用 的 工具 之 一 。 数 据 库 为 收集 、 组 织 和 共享 数据 
提供 了 基础 。 数 据 库 管理 方法 提供 了 很 多 传统 编程 技术 无 法 比拟 的 优势 ， 主 要 包括 更 短 的 开发 时 间 、 更 容易 修改 、 
更 好 的 数据 完整 性 与 安全 性 以 及 更 强 的 数据 共享 和 集成 。 而 DBMS 是 最 复杂 的 实用 技术 工具 之 一 ， 本 书 细致 讲解 了 
如 何在 商业 应 用 中 使 用 DBMS 。 

本 书 涵盖 了 构建 数据 库 前 的 两 个 关键 主题 : 数据 库 设计 (规范 化 ) 和 SQL (查询 )。 所 有 主要 的 数据 库 系 统 都 
涉及 这 两 个 主题 。 规 范 化 说 明了 如 何 细致 设计 数据 库 以 获得 DBMS 能 力 。SQL 是 一 种 标准 查询 语言 ， 事 实 上 用 于 应 
用 程序 开发 的 每 一 步 。 





本 书 特色 
1. 侧重 于 现代 业务 应 用 程序 开发 。 3 实用 的 业务 练习 和 案例 。 
e@ 根据 业务 模型 来 阐述 数据 库 设 计 。 @ 很 多 数据 库 设 计 问 题 :; 
e@ 通过 很 多 示例 和 练习 强调 动手 实践 应 用 。 涵盖 应 用 程序 开发 所 有 方面 的 练习 。 
9 侧重 于 新 型 图 形 用 户 界 面 应 用 程序 。 9 适用 于 期 末 实 践 项 目的 案例 。 
9 包含 数据 库 编程 和 应 用 程序 开发 的 内 容 。 4: 完整 的 示例 数据 库 应 用 程序 。 
e 关于 编程 和 开发 细节 内 容 的 附录 。 @ 功能 完善 的 业务 数据 库 。 
2. 热点 主题 。 @ 示例 数据 和 数据 产生 例 程 。 
e@ 介绍 并 使 用 统一 建 模 语言 (UML) 来 建 模 和 给 9 一 般 数 据 库 操作 的 示例 程序 代码 。 
制 系统 图 表 。 
@ 关于 数据 库 环境 下 安全 主题 的 深入 讨论 。 
@ 因特网 和 内 联网 的 数据 库 开 发 。 
@ 强调 SQL 92， 同 时 介绍 SQL 99 和 SQL 200x 
的 XML 特性 。 


e 数据 库 中 完整 的 应 用 程序 和 对 象 。 
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f Gerald V. Post = 管理 信息 系统 教授 ， 讲 授 管理 信息 系统 、 数 据 库 管理 、 
系统 开发 、 网 站 开发 等 课程 。 其 网 站 http: //jerrypost.com/DBBook//index.html 提 供 本 书 相关 资 

简 | 源 下 载 。 \ 








。 随 书 光盘 中 包括 ，PowerPoint 幻 灯 片 形式 的 讲课 记录 , 
为 特定 数据 库 技术 编制 的 工作 手册 ， 实 践 项 目 案例 。 
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本 书 涵盖 了 构建 数据 库 前 的 两 个 关键 主题 ， 数据库 设计 (规范 化 ) 和 SQL (查询 )。 
这 两 个 主题 贯穿 所 有 主要 的 数据 库 系 统 。 

本 书 分 四 个 部 分 ， 首 先 ， 对 数据 库 设 计 和 数据 规范 化 进行 介绍 ;， 其次， 讨论 如 何 将 
商业 问题 转化 为 SQL 查询 以 及 包括 子 查询 和 外 连接 的 查询 ， 然 后 讲解 表单 、 报 表 及 应 用 ， 
数据 库 完整 性 和 事务 以 及 数据 仓库 和 数据 挖 扎 ， 最 后 介绍 数据 库 管理 中 的 各 种 主题 ， 如 
安全 性、 分 布 式 数据 库 和 因特网 等 。 

本 书 适合 作为 高 等 院 校 相关 专业 数据 库 课 程 的 教材 ， 还 适合 非 计算 机 专业 的 管理 人 
员 建 立 和 应 用 数据 库 时 参考 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 芍 断 性 的 优势 ;也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 驭 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭 移 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信 息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 罗 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall，Addison-Wesley，McGraw-Hill，Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 颈 选 出 Tanenbaum，Stroustrup，Kernighan,， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 庆 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 从 书 ” 的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 相助 ， 国 内 的 专家 不 仅 提 供 了 中 
肯 的 选 题 指 导 ， 还 不 辞 劳 苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书” 已 经 出 版 了 近 百 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打下 了 坚实 的 基础 。 

随 着 学 科 建设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 和 人 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 ， 除 “计算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”， 同 时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
“全 美 经 典 学 习 指 导 系 列 ”。 为 了 保证 这 三 套 从 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科 技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交 通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 湖 
北 工学 院 、 中 国 国 家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意 见 和 出 版 监督 。 





IV 


这 三 套 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. I. T.，Stanford，U.C. Berkeley，C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 豪 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采 用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫 左 中 由 登 堂 而 入 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : | 


电子 邮件 : hzjsj@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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数据 库 是 最 重要 的 和 最 有 用 的 专业 管理 与 信息 技术 工具 之 一 。 数 据 库 提 供 了 收集 、 组 织 和 
共享 企业 数据 的 基础 。 例 如 ， 市 场 人 员 使 用 数据 库 来 分 析 销 售 数据 ， 人 力 资 源 管理 者 使 用 它 
来 评价 员工 的 表现 ， 业 务 管理 者 用 它 来 跟踪 并 提高 产品 的 质量 ， 会 计 人 员 用 它 来 整合 各 个 工 
厂 的 数据 ， 而 财务 分 析 家 使 用 它 来 分 析 整 个 公司 的 效益 。 

数据 库 管理 方法 与 传统 的 程序 设计 技术 相 比 ， 提 供 了 更 加 重要 的 优势 。 基 本 的 优势 包括 开 
发 时 间 短 、 容 易 更 新 、 较 好 的 数据 集成 和 数据 安全 ， 以 及 更 高 程度 的 数据 共享 和 数据 集成 。 
但 是 ， 数 据 库 管理 系统 (DBMS) 是 可 用 的 最 复杂 的 技术 工具 之 一 ， 只 有 仔细 设计 数据 库 才 能 
获得 这 些 优 势 。 大 型 的 商用 DBMS 提 供 了 成 千 上 万 的 选项 。 要 花费 几 个 月 的 时 间 才 能 全 部 掌握 
DBMS 特 有 的 功能 。 

目前 市 场 上 有 关 数 据 库 方面 的 书籍 主要 集中 在 高 校 教 材 方面 ， 主 要 讲述 数据 库 系统 的 原理 
和 设计 。 虽 然 也 有 一 些 关于 如 何 使 用 数据 库 系统 方面 的 书籍 ， 但 这 些 书 更 像 是 数据 库 管 理 员 
(DBA) 的 专业 培训 教材 。 而 有 关 如 何 利 用 DBMS 建 立 商业 应 用 的 书籍 很 少 。 

虽然 数据 库 常 常 是 由 信息 技术 方面 的 专家 来 创建 和 维护 的 ， 但 是 其 他 领域 的 管理 专家 也 越 
来 越 多 地 亲自 设计 和 建立 自己 的 数据 库 应 用 。 因 此 ， 我 们 将 本 书 翻译 介绍 给 非 计算 机 专业 的 
人 员 ， 尤 其 是 管理 人 员 ， 为 他 们 建立 自己 的 商业 数据 库 和 应 用 提供 全 方位 的 指导 与 训练 。 从 
专业 角度 讲 ， 本 书 适 合 大 学 三 年 级 的 学 生 学 习 如 何 设计 商业 数据 库 并 建立 应 用 ， 任 何 非 计算 
机 专业 的 学 生 都 能 够 理解 本 书 的 内 容 ， 尤 其 是 经 济 管理 专业 和 MBA 的 学 生 更 适合 以 本 书 作为 
数据 库 课 程 的 教材 。 

本 书 的 前 言 和 第 1 章 由 冯 建 华 负责 翻译 ， 第 一 部 分 (第 2、3 章 ) 由 刘 旭 辉 负责 翻译 ， 第 二 
部 分 (第 4、5 章 ) 由 林峰 负责 翻译 ， 第 三 部 分 (第 6、7、8 章 ) 由 周 维 续 负 责 翻译 ， 第 四 部 分 
(第 9、10 章 ) 和 词汇 表 由 贺 宇 凯 和 李 国 良 负责 翻译 ， 冯 建华 和 周 维 续 对 全 书 进行 了 审 校 。 

由 于 水 平 有 限 ， 在 翻译 过 程 中 难免 存在 着 这 样 或 那样 的 错误 ， 欢 迎 广大 读者 批评 、 指 正 。 


译 者 
2006 年 3 月 于 清华 园 





全 -2 
用 二 
两 个 网 站 的 故事 


Orinoco 音 乐 公司 引 以 为 豪 的 是 他 们 的 网 站 。 它 上 面 有 很 酷 的 图 片 ， 很 火爆 的 音乐 片段 。 
刚 开始 ， 新 闻 的 宣传 为 公司 带 来 了 大 量 的 潜在 客户 。 订 单 以 网 络 订购 的 形式 蜂拥 而 至 。 但 几 
周 之 后 ， 出 现 了 一 些 问题 。 职 员 从 网 页 向 公司 现 有 的 邮件 订购 系统 复制 订单 时 经 常 出 现 错误 。 
由 于 许多 商品 缺 货 ， 客 户 不 断 地 取消 订单 ， 并 且 抱 怨 如 果 他 们 知道 那些 商品 缺 货 的 话 ， 决 不 
会 去 订购 。 几 个 月 之 后 ， 新 闻 开 始 批评 这 个 网 站 ， 说 上 面 的 图 片 很 日， 并 且 大 家 不 能 获得 最 
新 乐队 的 音乐 片段 。 由 于 经 常 更 新 网 站 需要 很 大 的 开销 ，Orinoco 音 乐 公司 正 在 考虑 修改 这 个 
网 站 ， 把 它 改 成 一 个 基本 的 公司 信息 网 站 。 

客户 们 开始 光顾 Salt Peanuts 音 乐 公司 的 新 网 站 。 在 网 站 运行 的 一 个 月 间 ， 根 据 客户 数量 和 
每 笔 订单 的 金额 计算 ， 订 购 几 乎 翻 了 一 倍 。 用 户 可 以 立即 查看 某 件 商品 是 否 仍 有 库存 。 只 需 几 
次 点 击 ， 他 们 便 可 以 获取 任何 艺术 家 的 背景 信息 ， 并 且 可 以 试听 歌曲 的 小 片段 。 已 注册 的 客户 
付 一 些 费 用 就 可 以 将 歌曲 下 载 到 自己 的 计算 机 中 ， 随 意 播 放 。 客 户 也 可 以 通过 即时 消息 和 销售 
代表 沟通 。 销 售 代表 可 以 快速 获取 所 有 客户 的 数据 。 但 每 人 都 特别 喜欢 的 特色 是 系统 能 够 跟踪 
每 个 人 的 消费 并 提示 与 消费 者 相似 的 组 。 提 示 方 法 部 分 基于 专家 的 意见 ， 但 主要 由 对 消费 进行 
分 组 决定 。 客 户 可 以 查看 组 中 相似 客户 所 购买 的 商品 。 每 个 人 都 很 喜欢 这 个 系统 。 公 司 经 理 嘉 
欢 它 是 因为 它 能 促进 销售 ， 并 且 提 供 消费 趋势 的 详细 数据 。 客 户 们 喜欢 它 是 因为 他 们 能 够 立刻 
获得 想 要 的 信息 。 唱 片 作者 喜欢 它 是 因为 它 提 供 了 访问 他 们 作品 的 途径 并 能 提高 销量 。 

上 述 两 个 网 站 的 区 别 在 于 Salt Peanuts 网 站 建立 在 数据 库 管理 系统 之 上 ， 数 据 库 管理 系统 
集成 了 公司 的 数据 。 它 能 够 使 公司 创建 一 个 更 完整 、 可 交互 的 站 点 。 


本 书 内 容 简介 


对 于 管理 和 信息 技术 的 专业 人 员 来 说 ， 数 据 库 是 最 重要 和 最 实用 的 工具 之 一 。 数 据 库 为 
在 机 构 内 和 集成、 组织 和 共享 数据 提供 了 基础 。 事 实 上， 管理 的 每 一 个 领域 都 使 用 数据 库 管理 
系统 (DBMS) 。 例 如 ， 销 售 人 员 利 用 数据 库 来 分 析 销 售 数据 ， 人 力 资源 经 理 用 它 来 评估 员工 ， 
执行 经 理 用 它 来 跟踪 并 提高 质量 ， 会 计 用 它 来 合计 公司 内 的 数据 ， 而 财务 分 析 员 用 它 来 分 析 
一 个 公司 的 业绩 。 

数据 库 管理 方法 具备 很 多 传统 编程 技术 无 法 比拟 的 优势 。 主 要 的 优势 包括 更 短 的 开发 时 
闻 、 更 容易 修改 、 更 好 的 数据 完整 性 与 安全 性 及 更 强 的 数据 共享 和 集成 。 然 而 ，DBMS 是 最 复 
杂 的 实用 技术 工具 之 一 。 需 要 细致 设计 数据 库 以 实现 这 些 优势 。 一 个 大 规模 商用 数据 库 提供 
了 数 千 种 选项 并 且 价 值 数 十 万 美元 。 掌 握 某 一 特定 DBMS 的 全 部 特性 可 能 需要 花费 数 月 时 间 。 

尽管 数据 库 一 般 由 信息 技术 专业 人 员 创 建 和 维护 ， 越 来 越 多 的 其 他 学 科 的 管理 专业 人 员 
也 开始 设计 和 创建 他 们 自己 的 数据 库 应 用 程序 。 本 书 适用 于 大 学 三 年 级 水 平 的 初级 商业 数据 
库 课程 。 任 何 专业 的 学 生 都 能 够 理解 本 书 的 内 容 ， 但 如 果 他 们 已 经 学 过 一 门 初级 编程 课程 的 
话 ， 理 解 起 来 将 会 更 容易 一 些 。 
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本 书目 标 和 基本 原理 


本 书 的 目标 明确 : 学 习 过 本 书 之 后 ， 学 生 应 该 能 够 评估 业务 情况 并 构建 一 个 数据 库 应 用 
程序 。 


最 好 情况 : 
将 时 间 花 在 设计 和 SQL 上 


用 编程 来 弥补 低 质量 设计 和 有 限 的 SQL 





本 书 的 核心 包括 每 个 学 生 在 构建 数据 库 前 必须 学 习 的 两 个 关键 主题 : 数据库 设 计 (规范 
化 ) 和 SQL (查询 )。 所 有 主要 的 数据 库 系 统 都 涉及 这 两 个 主题 。 规 范 化 说 明了 如 何 细致 设计 
数据 库 以 获得 DBMS 能 力 。SQL 是 一 种 标准 查询 语言 ， 事 实 上 用 于 应 用 程序 开发 的 每 一 步 。 
这 两 个 主题 必须 仔细 彻底 地 对 待 ， 特 别 是 由 于 它们 对 于 学 生来 说 都 是 困难 的 主题 。 

尽管 某 些 学 生 可 以 通过 一 次 普通 讨论 或 讲座 学 会 如 何 构建 应 用 程序 ， 但 大 部 分 人 则 需要 
在 知识 济 博 的 教师 的 指导 下 通过 示例 和 亲手 实践 来 弄 懂 。 本 书 通过 清楚 的 讲解 、 众 多 示例 、 
练习 和 示例 数据 库 为 学 习 过 程 提 供 支 持 。 附 带 的 工作 手册 提供 了 使 用 特定 数据 库 系 统 构 建 应 
用 程序 的 更 多 细节 。 

利用 传统 的 关系 数据 库 构 建 应 用 程序 需要 三 种 特别 的 技能 ， 数 据 库 设计 、SQL 知 识 和 编 
程 。 这 三 种 技能 中 的 每 一 项 都 很 复杂 ， 但 每 一 项 对 于 构建 成 功 的 应 用 程序 都 是 至 关 重 要 的 。 

数据 库 设 计 是 构建 应 用 程序 的 基础 。 一 个 设计 良好 的 数据 库 能 够 简化 应 用 程序 的 构建 、 
维护 和 扩充 过 程 。 关 系数 据 库 设计 的 一 个 重点 是 它 的 灵活 性 。 一 个 设计 合理 的 数据 库 能 够 扩 
充 以 适应 业务 情形 的 变化 。 另 一 方面 ， 如 果 设 计 很 差 ， 构 建 应 用 程序 实际 上 将 会 更 难 且 花费 
更 多 时 间 。 一 般 来 说 ， 抛 弃 一 个 设计 很 差 的 数据 库 并 重新 开始 ， 要 好 于 尝试 修补 或 扩展 它 。 

SQL 是 一 种 强大 的 查询 语言 。 它 最 强 的 能 力 之 一 在 于 它 能 够 应 用 于 许多 不 同 的 产品 中 。 
一 旦 你 学 会 了 SQL 的 基础 ， 你 将 能 够 从 几乎 所 有 的 数据 库 系 统 中 获取 数据 。 很 多 SQL 查询 语 
句 是 相对 简单 的 ， 所 以 学 会 SQL 基础 是 很 快 的 。 然 而 ，SQL 也 可 以 用 于 解决 复杂 的 问题 。 

编程 技巧 组 成 了 构建 可 靠 商业 应 用 程序 所 需 知识 的 第 三 个 层次 。 某 些 应 用 程序 和 数据 库 
系统 需要 详细 的 编程 技巧 。 然 而 ， 在 很 多 情况 下 编程 用 得 还 很 不 够 。 编 程 可 用 于 集成 不 同 的 
组 件 或 添加 新 的 功能 ， 以 使 应 用 程序 更 容易 使 用 。 

大 部 分 应 用 程序 都 会 经 历 在 数据 库 设计 、SQL 语 言 和 编程 三 者 间 的 协调 。 设 计 越 差 、 对 
SQL 的 依赖 越 小 ， 在 构建 应 用 程序 时 需要 的 编程 将 会 越 多 。 由 于 编写 代码 似乎 更 容易 出 错 并 
且 更 难以 修改 ， 应 用 程序 开发 人 员 应 该 依赖 于 合理 的 数据 库 设 计 和 SQL 语言 的 能 力 。 


学 习 评估 
学 习 评 估 对 于 学 生 、 教 师 和 老板 来 说 都 是 重要 的 。 学 生 需 要 确定 哪些 方面 是 他 们 的 强项 ， 
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而 哪些 方面 则 需要 额外 的 努力 。 学 生 需 要 明白 ， 如 果 能 够 成 功 学 会 本 书 的 内 容 ， 他 们 将 能 够 
掌握 很 多 技巧 ， 这 些 技巧 将 会 使 他 们 获得 工作 ， 并 能 通过 快速 构建 和 维护 业务 应 用 程序 ， 从 
而 在 职业 上 有 所 作为 。 

这 门 课 程 的 学 习 评估 很 明确 : 学 习 本 课程 之 后 ， 学 生 应 该 能 够 评 佑 业务 情况 并 开发 一 个 
数据 库 应 用 程序 。 这 个 应 用 程序 的 复杂 度 和 所 使 用 的 工具 将 取决 于 特定 的 班级 和 学 生 的 背景 。 
一 般 来 说 ， 布 置 一 个 为 期 一 学 期 的 实践 项 目 是 评估 全 部 技能 的 好 方法 。 期 末 的 实践 项 目 可 以 
通过 以 下 几 方 面 来 评定 : (1) 正确 符合 业务 需求 ，(2) 有 效 的 数据 库 结构 ，(3) 可 用 性 。 

对 个 人 技能 进行 独立 评估 也 是 很 有 用 的 ， 尤 其 是 以 组 为 单位 创建 期 末 实 践 项 目的 时 候 。 
在 这 种 情况 下 ， 评 估 包 括 以 下 个 人 测试 : (1) 数据 库 设计 和 规范 化 ，(2) SQL 和 根据 业务 问 
题 创建 查询 ，(3) 精 选 的 主题 包括 数据 库 编程 、 安 全 性 、 数 据 挖掘 和 分 布 式 系统 。 


结构 


本 书 的 结构 遵从 应 用 程序 开发 的 基本 步骤 : 设计 、 查 询 、 应 用 、 管 理 和 高 级 主题 。 一 些 
教师 可 能 会 选择 在 讲授 数据 库 设 计 前 讲授 查询 ， 因 此 ， 前 面 几 章 在 写作 时 保留 了 这 种 灵活 性 。 

简介 解释 了 数据 库 的 重要 性 ， 并 将 数据 库 应 用 程序 与 学 生 可 能 在 其 他 课 上 学 过 的 主题 进 
行 联系 。 

数据 库 设计 部 分 有 两 章 : 第 2 章 是 设计 技术 概述 (系统 技术 ， 图 表 和 控制 ) ， 第 3 章 详 述 数 
据 规 范 化 。 这 部 分 内 容 的 目标 是 : 在 学期 初 阐述 设计 以 便 学 生 能 够 开始 他 们 的 实践 项 目 。 

查询 用 两 章 来 讲解 。 第 4 章 介 绍 查询 并 集中 于 将 业务 问题 转化 为 SQL 查询 的 基础 。 第 5 章 
讨论 了 更 复杂 的 查询 ， 包 括 子 查询 和 外 连接 。 

第 3 部 分 描述 了 数据 库 应 用 程序 开发 ， 第 6 章 作为 该 部 分 的 开始 讲解 表单 、 报 表 和 应 用 的 
开发 。 第 7 章 研究 在 多 用 户 环 境 中 产生 的 常见 问题 ， 阐 述 了 用 于 处 理 数 据 完整 性 和 事务 的 常用 
技术 。 第 8 章 解 释 为 何 与 事务 处 理 相 比分 析 处 理 需要 不 同 的 数据 库 配 置 。 它 涵盖 用 于 在 非 静态 
上 下 文中 进行 分 析 和 数据 挖掘 的 主要 工具 。 


第 1 章 简介 
第 1 部 分 系统 设计 

第 2 章 数据 库 设 计 

附录 数据 库 设计 系统 

第 3 章 数据 规范 化 

附录 规范 化 的 形式 化 定义 
第 2 部 分 查询 

第 4 章 数据 查询 

附录 SQL 语法 

第 5 章 高 级 查询 和 子 查询 

附录 程序 设计 简介 
第 3 部 分 应 用 

第 6 章 表单 、 报 表 和 应 用 

第 7 章 数据 库 集成 和 事务 

第 8 章 数据 仓库 和 数据 挖掘 
第 4 部 分 数据 库 管理 

第 9 章 数据 库 管理 

第 10 章 分 布 式 数据 库 和 因特网 
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第 4 部 分 研究 了 数据 库 管理 中 的 各 种 主题 。 第 9 章 研究 管理 问题 ， 重 点 强调 计划 、 实 现 、 
性 能 和 安全 性 。 它 阐述 了 管理 员 需 要 负责 的 主要 任务 和 控制 。 第 10 童 探讨 了 为 数据 库 提供 分 
布 式 访问 的 日 益 增 加 的 重要 性 。 它 阐述 各 种 网 络 配置 的 效果 ， 还 讨论 如 何 将 数据 库 连 接 到 网 
站 以 通过 浏览 器 访问 。 

此 外 ， 全 书 中 有 四 章 包含 附录 ， 讨 论 了 技术 性 更 强 的 编程 概念 。 第 2 章 的 附录 描述 了 可 供 
教师 和 学 生 使 用 的 联机 数据 库 设 计 系 统 。 它 为 数据 库 设 计 提 供 了 即时 反馈 ， 使 学 生 更 容易 理 
解 问题 和 探究 不 同 的 设计 。 第 3 章 的 附录 介绍 了 规范 化 的 形式 化 定义 。 它 是 为 那些 想 查 看 更 多 
形式 化 的 集合 理论 定义 的 教师 和 学 生 而 提供 的 。 第 4 章 的 附录 是 SQL 基本 语句 的 简捷 列表 。 第 
5 章 的 附录 提供 了 程序 设计 简介 。 它 可 作为 总 结 或 简单 备 忘 记录 。 


教学 特点 


本 书 的 教学 目标 很 明确 ， 并 且 在 每 一 章 中 都 进行 强调 ， 那 就 是 学 习 本 书 之 后 ， 学 生 应 该 
能 够 使 用 DBMS 构 建 商业 应 用 程序 。 本 书 使 用 示例 来 应 用 书 中 所 阐述 的 概念 。 应 当 鼓 励 学 生 
通过 解答 每 章 的 练习 题 和 完成 期 末 实 践 项 目 来 应 用 知识 。 

每 章 包含 若干 节 帮 助 读者 对 本 书 的 理解 ， 并 帮助 读者 将 其 应 用 于 设计 和 创建 业务 应 用 程 
序 上 。 这 些 部 分 包括 : 

* 本章 学 习 内 容 : 关于 本 章 内 容重 点 和 用 途 的 简短 讨论 。 

“ 小 结 : 对 本 章 主题 的 简要 回顾 。 

“开发 漫谈 : 每 章 都 以 一 段 情 景 对 话 作为 开头 和 结尾 ， 对 话 中 讲述 了 本 章 所 学 内 容 在 实际 

中 的 应 用 。 

"关键 词 : 本 章 中 介绍 的 术语 列表 。 本 书 的 最 后 提供 了 一 个 完整 的 词汇 表 。 

* 补充 读物 : 关于 主题 的 更 详细 研究 的 参考 文献 。 

“参考 网 站 : 一 些 提 供 主题 相关 详细 信息 的 网 站 。 其 中 一 些 是 新 闻 组 ， 开 发 人 员 分 享 问题 

和 技巧 。 

“复习 题 : 作为 学 习 指 南 用 于 备考 。 

。 练 习 : 涉及 本 章 中 出 现 的 概念 的 问题 。 大 部 分 需要 使 用 DBMS 。 

“ 项目: 在 正文 后 面 的 附录 中 提供 了 若干 较 长 的 项 目 。 它 们 适合 作为 期 末 实 践 项 目 。 

“工作 手册 : 工作 手册 对 于 第 3 版 来 说 是 新 内 容 ， 它 提供 了 使 用 特定 工具 构建 数据 库 的 细 

节 工 作 。 工 作 手 册 的 每 一 章 都 举例 说 明了 与 书 中 所 讨论 内 容 配套 的 任务 。 工 作 手册 还 提 

供 练习 ， 用 于 为 不 同 公司 构建 6 个 数据 库 。 

。 示 例 数 据 库 : 提供 了 两 个 示例 数据 库 用 于 举例 说 明 书 中 讲述 的 概念 。Sally 的 宠物 商店 

例 举 了 一 个 处 于 早期 设计 阶段 的 数据 库 ， 而 Rolling Thunder 自 行车 提供 了 一 个 更 加 完 . 

整 的 应 用 程序 。 它 由 现实 的 数据 构成 。 在 本 书 各 章 提供 了 有 关 这 两 个 数据 库 的 练习 。 


本 书 特 色 


1. 侧重 于 现代 业务 应 用 程序 开发 。 
“根据 业务 模型 来 曾 述 数据 库 设计 。 
“通过 很 多 示例 和 练习 强调 动手 实践 应 用 。 
“ 侧重 于 新 型 图 形 用 户 界面 应 用 程序 。 
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。 讲 述 数 据 库 编 程 和 应 用 程序 开发 的 章节 。 
*。 关 于 编程 和 开发 细节 内 容 的 附录 。 
2. 热点 主题 。 
。 介 绍 并 使 用 统一 建 模 语 言 (UML ) 来 建 模 和 绘制 系统 图 表 。 这 种 新 标准 将 很 快 被 所 
有 设计 者 使 用 。 
。 关 于 数据 库 环 境 下 安全 主题 的 深入 讨论 。 
*。 因特网 和 内 联网 的 数据 库 开 发 。 
。 强 调 SQL 92， 同 时 介绍 SQL 99 和 SQL 200x 的 XML 特性 。 
。 数据库 中 集成 的 应 用 程序 和 对 象 。 
. 实用 的 业务 练习 和 案例 。 
。 很 多 数据 库 设 计 间 题 。 
。 涵盖 应 用 程序 开发 所 有 方面 的 练习 。 
* 适 用 于 期 末 实 践 项 目的 案例 。 
一 个 完整 的 示例 数据 库 应 用 程序 (Rolling Thunder 自 行车 ) 。 
* 功 能 完善 的 业务 数据 库 。 
“。 示例 数据 和 数据 生成 器 例 程 。 
。 常 见 数据 库 操作 的 示例 程序 代码 。 
. 用 于 比较 和 附加 任务 的 第 二 个 数据 库 (Sally 的 宠物 商店 ) 。 
PowerPoint 幻 灯 片 形式 的 讲课 记录 。 
为 特定 数据 库 技 术 编 制 的 工作 手册 ， 其 中 举例 说 明了 亲手 构建 一 个 实际 应 用 程序 所 需 的 
步骤 。 最 初 ， 印 刷 好 的 工作 手册 是 和 微软 的 Access 和 Oracle 配 套 的 。 读 者 与 出 版 者 和 教师 协商 
以 获取 对 于 其 他 系统 和 工具 的 支持 。 
8. 附加 信息 和 章节 。 为 了 缩减 本 书 的 篇 幅 ， 早 期 的 一 些 章节 一 一 特别 是 对 物理 数据 存储 
(B 树 ) 的 分 析 已 经 以 电子 文件 的 形式 转 存 到 随 书 光盘 上 了 。 


期 末 实 践 项 目 


各 章 后 面 的 附录 中 介绍 了 很 多 项 目 。 这 些 项 目 适 合作 为 期 末 的 实践 项 目 。 学 生 应 当 能 够 
在 一 学 期 内 构建 一 个 完整 的 应 用 程序 。 最 终 的 成 绩 应 当 侧 重 于 这 个 期 末 实 践 项 目 。 教 师 至 少 
应 当 对 两 个 中 间 阶 段 进行 评定 ，(1) 在 学 完 第 3 章 后 的 短期 内 收集 一 系列 规范 化 表 ，(2) 在 学 
完 第 6 章 后 的 短期 内 收集 设计 预览 ， 预览 至 少 要 包括 两 个 主要 表单 和 两 个 报告 。 工 作 手 册 中 的 
6 个 额外 案例 也 可 以 用 做 期 未 实践 项 目 。 

一 些 教师 可 能 会 选择 以 小 组 作业 的 方式 来 布置 实践 项 目 。 然 而 ， 应 当 尽量 避免 这 种 方式 ， 
要 求学 生 独 立 完成 工作 。 实 践 项 目 是 一 种 关键 的 学 习 工 具 。 如 果 组 内 的 一 些 成 员 逃 避 实 践 项 
目的 工作 ， 他 们 将 失去 一 次 重要 的 学 习 机 会 。 


数据 库 设计 和 统一 建 模 语言 


许多 年 来 ， 实 体 关 系 图 在 数据 库 设 计 建 模 方法 中 占有 统治 地 位 。 然 而 ， 由 于 有 很 多 种 不 同 的 
绘图 方法 ， 这 种 建 模 方法 给 教师 (和 学 生 ) 带 来 了 麻烦 。 与 以 往 版 本 一 样 ， 本 书 使 用 统一 建 模 语 
言 (UML) 方法 代替 传统 的 实体 关系 (ER) 图 作为 数据 库 设 计 的 建 模 方法 ， 从 而 解决 这 些 问题 。 


LS 


be 


2av 





XI 


从 表面 上 看 ， 这 种 改变 几乎 就 是 将 ER 图 的 符号 和 术语 用 UML 类 图 中 的 并 行 概念 进行 替代 。 

UML 类 图 与 ER 图 非常 相似 ,但 它 在 很 多 方面 具有 优势 。 首 先 ， 它 们 是 标准 化 的 ， 这 样 学 
生 (和 教师 ) 只 需 学 习 一 种 符号 集合 。 第 二 ， 它 们 因为 没有 传统 ER 图 中 无 用 的 和 含义 模糊 的 
符号 而 更 容易 阅读 ， 从 这 种 意义 上 说 它们 更 “干净 ”。 第 三 ， 它 们 提供 对 于 面向 对 象 设计 的 介 
绍 ， 因 此 学 生 能 够 更 好 地 为 将 来 的 开发 做 准备 。 第 四 ， 随 着 UML 作 为 一 种 标准 设计 方法 被 迅 
速 采纳 ， 学 生 能 够 更 好 地 为 开展 未 来 的 工作 做 准备 。 很 多 系统 设计 团体 已 经 采用 UML 作 为 设 
计 系统 的 一 种 标准 方法 。UML 由 系统 设计 的 主要 创造 者 (例如 Booch，Rumbaugh 和 Jacobsen) 
提供 支持 ， 同 时 重要 的 软件 公司 (包括 IBM，Microsoft 和 Oracle) 也 对 它 提供 支持 。 
Mircosoft Access 和 SQL Server 都 使 用 一 种 类 似 于 UML 的 绘图 工具 。 此 外 ， 如 果 学 生 需 要 使 用 
老式 的 ER 方法 ， 他 们 在 迁移 其 UML 方 法 的 知识 时 将 不 会 感到 困难 。 

ER 图 和 类 图 的 基本 相似 点 在 于 : (1) 实体 (类) 用 算 形 绘制 ， (2) 二 元 关系 (联系 ) 
以 连接 线 绘制 ， (3) n 元 联系 (关联) 用 菱形 绘制 。 这 样 ， 总 体 结构 是 相似 的 。UML 和 ER 图 
的 区 别 主 要 体现 在 细节 上 。 在 UML 中 ， 关 联 的 多 样 性 以 简单 的 数字 符号 显示 ， 而 不 是 以 一 个 
含义 模糊 的 图 标 显示 。 下 面 两 图 中 列举 了 一 个 示例 。 
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UML 也 能 表示 zx 元 关联 并 人 允许 将 关联 定义 为 类 。 这 里 能 够 表示 所 有 关联 的 命名 ， 包 括 导 航 
名 称 以 便于 辅助 读 图 。 在 一 些 情形 下 还 定义 了 表示 关联 结束 的 图 标 ， 例 如 布局 (ER 很 少 进行 
处 理 ) 和 子 类 型 (ER 中 只 提供 了 很 少 支持 )。 

UML 方 法 的 更 多 细节 在 第 2 章 和 第 3 章 中 讲解 。 本 书 中 只 使 用 很 小 部 分 的 UML 图 、 符 号 和 
术语 。 你 可 以 在 http:/www.rational.com/uml/ 网 站 上 找到 完整 的 规范 。 


教学 支持 


。 具 有 多 项 选择 题 、 简 答题 和 小 规模 项 目的 测试 库 可 以 和 Irwin/McGraw-Hill 的 电子 测试 库 
软件 一 起 使 用 。 

。 讲 课 记 录 和 帮助 以 Microsoft PowerPoint 幻 灯 片 格式 提供 。 幻 灯 片 包含 所 有 图 片 和 附加 记 
录 。 幻 灯 片 以 讲课 形式 组 织 ， 并 且 可 以 重新 排列 以 适合 个 人 偏好 。 

。 光 盘 上 提供 了 许多 数据 库 和 练习 。 教 师 可 以 添加 新 数据 ， 修 改 练习 ， 或 者 使 用 它们 扩充 
本 书 中 的 讨论 。 

。Sally 的 宠物 商店 数据 库 应 用 程序 以 后 端 数 据 库 格式 提供 ， 数 据 库 的 格式 包括 Microsoft 
Access，SQL Server 和 Oracle。 前 端 以 Microsoft Access、Oracle、Visual Basic 6 和 ASP 
网 页 形式 提供 。 在 本 书 中 大 量 使 用 了 此 应 用 程序 来 阐明 主题 。 与 Rolling Thunder 示 例 相 
比 ， 宠 物 商店 示例 处 于 设计 的 早期 阶段 ， 这 是 由 于 以 下 两 个 主要 原因 。(1) 学 生 能 够 比 
较 这 两 个 应 用 程序 并 且 洞 察 开 发 步骤 ， (2) 可 以 给 学 生 布置 作业 来 为 宠物 商店 应 用 程 
序 添加 额外 的 功能 。 : . 

。Rolling Thunder 示 例 数据 库 适 用 于 Oracle，SQL Server 和 Microsoft Access， 但 应 用 程序 
窗 体 只 能 运行 在 Microsoft Access 下 。 它 是 一 个 独立 的 应 用 程序 ， 示 例 说 明了 很 多 概念 
并 使 学 生 能 够 研究 一 个 完整 数据 库 应 用 程序 的 众多 方面 ， 包 括 应 用 程序 的 代码 。 

。 通 过 互联 网 站 点 http://JerryPost.com 可 以 与 作者 进行 直接 沟通 。 

。 通 过 互联 网 站 点 http://www.mhhe.com 可 以 与 出 版 者 进行 直接 沟通 。 


第 3 版 的 变化 


” ”第 3 版 中 最 重要 的 变化 就 是 增加 了 工作 手册 。 将 数据 库 细 节 材 料 转 移 到 工作 手册 中 能 够 缩 
减 正文 的 篇 幅 并 且 在 工作 手册 中 提供 更 详细 的 帮助 。 尽 管 本 书 仍然 是 以 应 用 程序 为 导向 的 ， 
本 书 还 是 在 主体 内 容 中 采取 更 一 般 的 方法 来 介绍 较 难 的 主题 。 本 书 将 重点 为 学 生 提供 设计 、 
查询 和 构建 数据 库 所 需 的 基本 技能 和 知识 。 工 作 手 册 提 供 详细 的 数据 库 细 节 帮 助 ， 并 将 任务 
转化 为 解决 构建 应 用 程序 中 的 特定 问题 。 工 作 手册 可 用 于 实验 室 环境 ， 或 者 作为 帮助 学 生 设 
计 和 构建 其 实践 项 目的 单独 说 明 。 

第 3 版 中 还 包含 关于 数据 仓库 和 数据 挖掘 的 扩充 讨论 。 这 些 概念 在 一 个 新 章 (第 8 章 ) 中 
详 述 。 第 7 章 关于 完整 性 和 事务 的 介绍 包含 数据 库 触发 器 、 事 务 和 键 生成 问题 重要 性 的 扩展 。 
构建 一 个 应 用 程序 的 概念 已 经 被 整理 并 简化 到 第 6 章 。 详 细 的 步骤 在 工作 手册 中 进行 介绍 。 

此 外 ， 需 要 注意 的 是 大 部 分 练习 都 已 经 替换 过 。 旧 的 练习 可 在 光盘 中 和 作者 的 网 站 上 找到 。 
此 版 本 在 附录 中 包含 案例 ， 称 为 数据 库 项 目 。 所 有 旧 的 案例 都 已 经 转移 到 了 光盘 和 网 站 上 。 除 
提供 新 项 目 之 外 ， 本 书 的 目的 是 创建 稍 小 型 的 案例 以 便 学 生 能 够 在 一 个 学 期 中 完成 。 


设计 反馈 工具 
本 书 的 另 一 个 重要 的 新 元 素 是 拥有 联机 数据 库 设计 系统 。 这 个 联机 专家 系统 在 教授 数据 
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库 设 计 和 数据 规范 化 方面 是 一 个 很 大 的 进步 。 学 生 使 用 支持 Java 的 网 页 浏览 器 来 绘制 设计 图 
并 将 它们 保存 在 中 央 服 务 器 上 。 鼠 标 单 击 之 后 ， 服 务 器 评定 设计 图 并 提供 对 设计 的 即时 反馈 。 
反馈 以 提示 和 问题 的 形式 指导 学 生 重 新 考虑 表 的 设计 。 教 师 能 够 在 几 分 钟 之 内 设 定 班级 和 作 
业 ， 并 且 可 以 定制 问题 、 解 决 方案 和 成 绩 评定 标准 。 教 师 其 至 能 够 创建 新 的 问题 ， 但 是 系统 
已 经 包含 了 很 多 练习 ， 包 括 本 书 三 个 版 本 中 的 所 有 问题 。 教 师 需 要 签约 才能 在 课堂 中 使 用 此 
系统 。 确 认 网 站 为 http://time-post.com/dbdesign。。 
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第 1 章 


简 介 





本 章 学 习 内 容 


“什么 是 数据 库 ? 
“什么 是 数据 库 管理 系统 ? 

“ 数据库 管理 系统 的 主要 组 件 是 什么 ? 
* 使 用 数据 库 管理 系统 的 优势 是 什么 ? 
“ 数据库 管理 系统 的 主要 类 型 有 哪些 ? 


1.1 开发 漫谈 


Miranda， 我 叔叔 刚刚 打 电 话 给 我 ， 说 他 的 公司 经 营 得 很 艰难 。 公 司 需要 找 个 人 为 销售 
部 写 一 个 应 用 。 公 司 需要 一 个 便携 式 电脑 系统 ， 每 个 销售 人 员 可 以 用 它 来 输 
和 订单。 系统 需要 随时 跟踪 订单 状态 并 且 生 成 通知 和 周报 。 我 权 权 说 我 应 该 
去 做 这 份 工作 ， 因 为 我 在 电脑 方面 懂得 很 多 。 他 的 公司 愿意 支付 6000 美 元 ， 
并 且 我 可 以 兼职 。 

Ariel: 哇 ! 听 起 来 似乎 是 个 不 错 的 工作 。 有 什么 困难 吗 ? 

Miranda， 唔 ， 我 会 使 用 基本 的 计算 机 工具 ， 也 会 一 点 点 编程 ， 但 是 我 不 确定 我 能 不 能 
创建 一 个 完整 的 应 用 。 这 可 能 会 花费 很 长 时 间 。 

Ariel， 为 什么 不 使 用 数据 库 管 理 系统 呢 ? 这 要 比 从 零 开 始 写 程序 容易 很 多 。 

Miranda: 真是 这 样 吗 ? 数据 库 系 统 能 做 些 什 么 ?怎么 做 ? 


1.2 简介 


你 想 建立 计算 机 管理 的 商业 应 用 吗 ? 你 想 创建 能 在 多 个 地 点 运行 的 商业 应 用 吗 ? 你 想 在 互 
联网 上 管理 业务 吗 ?你 想 让 用 户 在 网 上 提交 订单 吗 ? 如 果 想 创建 一 个 现代 化 的 商业 应 用 ， 你 
就 需要 数据 库 管理 系统 。 

现代 化 的 数据 库 系统 是 建立 商业 应 用 最 强 有 力 的 工具 之 一 。 它 具有 很 多 功能 ， 相 比 传统 的 
编程 方法 具有 巨大 的 优势 。 但 它 十 分 复杂 。 为 了 实现 这 些 优势 ， 数 据 必须 进行 精心 地 组 织 。 
要 获取 数据 并 建立 应 用 ， 你 必须 学 会 使 用 一 种 强大 的 查询 语言 。 一 旦 你 了 解 了 数据 库 设 计 、 
查询 和 建立 应 用 的 概念 ， 你 就 能 够 创建 复杂 的 应 用 ， 而 所 花费 的 时 间 只 是 传统 编程 技术 所 需 
时 间 的 一 小 部 分 。 


数据 库 是 以 标准 格式 存储 的 数据 的 集合 ， 一 般 设 计 成 多 用 户 共享 方式 。 数 据 库 管 理 系统 
(DBMS) 是 一 种 特殊 的 软件 ， 它 定义 数据 库 、 存 储 数 据 、 支 持 某 种 查询 语言 、 生 成 报表 并 且 
创建 数据 项 显示 界面 。 

创建 应 用 过 程 中 最 复杂 的 一 些 问题 来 源 于 存储 和 获取 数据 。 这 些 问题 包括 节约 空间 ， 快 
速 获取 数据 ， 多 用 户 同时 共享 数据 以 及 提供 数据 备份 和 恢复 。 起 初 ， 对 创建 的 每 一 个 应 用 ， 
程序 员 都 不 得 不 处 理 这 些 问题 。 如 今 ，DBMS 已 经 为 这 些 问题 提供 了 一 个 最 好 的 解决 办 法 。 
将 数据 库 作 为 应 用 的 基础 ， 意 味 着 你 可 以 获得 所 有 强大 的 功能 和 安全 性 而 不 需要 做 太 多 额外 
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1.3 数据 库 和 应 用 开发 


在 过 去 的 几 年 间 ， 数 据 库 系统 已 经 成 为 几乎 所 有 应 用 开发 项 目的 基础 。 从 大 型 的 企业 关系 
系统 ， 到 电子 商务 网 站 、 独 立 的 商业 应 用 。 数 据 库 系 统 高 效 地 存储 和 获取 数据 ， 保 障 安全 性 ， 
并 使 得 建立 应 用 更 加 容易 。 现 在 ， 当 建立 或 修改 一 个 应 用 的 时 候 ， 你 会 首先 创建 数据 库 。 要 
理解 DBMS 的 能 力 和 如 何 利用 它们 来 创建 应 用 ， 最 好 研究 一 下 开发 应 用 的 过 程 。 

企业 组 织 一 般 遵 循 图 1-1 中 描述 的 基本 步 又 来 开发 科技 应 用 。 大 型 项 目的 每 个 阶段 可 能 需 
要 几 个 人 ， 而 小 一 些 的 项 目 可 能 只 需要 一 两 个 开发 人 员 就 能 完成 所 有 任务 。 企 业 组 织 可 以 依 
据 每 一 步骤 重新 安排 任务 ， 但 是 整个 项 目 要 成 功 ， 必 须 完成 所 有 的 任务 。 在 可 行 性 步骤 中 要 
定义 项 目 和 提供 成 本 估算 。 在 分 析 阶 段 ， 系 统 分 析 员 从 用 户 那 里 收集 数据 定义 、 表 单 和 报表 ， 
用 于 设计 数据 库 和 所 有 的 新 表单 、 报 表 以 及 用 户 交互 。 在 开发 阶段 ， 要 创建 表单 、 报 表 和 应 
用 功能 ， 例 如 帮助 文档 。 执 行 阶段 大 体 上 包括 传输 数据 、 安 装 、 训 练 和 评价 。 


任务 


确定 范围 ， 成 本 和 时 间 表 
从 用 户 那 里 收集 信息 
定义 表 ， 关 系 ， 表 单 和 报表 


创建 表单 、 报 表 和 帮助 ， 测 试 


传输 数据 ， 安 装 ， 训 练 ， 评 价 





时 间 


图 1-1 系统 开发 。 尤 其 对 于 大 型 项 目 ， 将 应 用 开发 分 解 为 独立 的 步骤 是 非常 有 
用 的 。 这 样 能 够 跟踪 开发 困 队 的 进度 并 且 突 出 尚未 完成 的 步骤 。 对 于 某 
些 项 目 而 言 ， 一 些 任务 可 能 重 倒 或 迭代 ， 但 不 应 跳 过 任何 步 又 


对 于 数据 库 驱动 的 应 用 ， 设 计 阶 段 是 至 关 重要 的 。 数 据 库 系统 及 其 相关 的 开发 工具 极其 强 
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大 ， 而 数据 库 必 须 精心 设计 才能 有 效 地 利用 。 图 1-2 显 示 了 业务 规则 和 流程 被 转化 为 数据 库 表 
和 关系 的 定义 。 表 单 用 于 向 数据 库 传 输 数据 ， 而 报表 用 于 通过 查询 获取 并 显示 用 户 所 需 的 数 
据 。 这 些 表单 、 报 表 连 同 诸如 菜单 和 帮助 这 样 的 功能 组 成 了 应 用 。 用 户 通常 看 到 的 只 是 应 用 
程序 界面 而 非 底 层 的 数据 库 或 表 。 

在 创建 数据 库 应 用 的 过 程 中 ， 设 计数 据 库 表 和 关系 是 一 个 关键 步骤 。 定 义 表 的 过 程 和 规则 
将 在 第 2 章 和 第 3 章 进 行 详细 介绍 。 使 用 数据 库 需 要 获取 和 操纵 数据 。 这 些 工作 由 查询 系统 完 
成 ， 将 在 第 4 章 和 第 5 章 进行 描述 。 有 了 这 些 基础 ， 使 用 工具 创建 表单 、 报 表 并 将 其 集成 到 应 
用 当中 就 相对 简单 了 ， 这 些 将 在 第 6 章 进 行 讨论 。 








二 . 确定 业务 规则 


2. 定义 表 和 关系 


i 
Ce 





图 1-2 数据 库 设计 的 步骤 。 业 务 规则 和 数据 用 于 定义 数据 库 表 。 表 单 用 于 
输入 新 数据 。 数 据 库 系统 获取 数据 来 回答 查询 并 生成 报表 。 用 户 只 能 
以 表单 和 报表 的 形式 查看 应 用 


1.4 数据 库 管理 系统 的 组 成 


通过 DBMS 提 供 的 一 般 组 件 可 以 了 解 DBMS 的 价值 。 当 你 需要 评价 不 同 的 产品 ， 确 定 你 
的 公司 应 该 使 用 哪 种 DBMS 时 ， 本 节 的 基本 组 件 列表 将 会 十 分 有 用 。 每 个 DBMS 都 有 自己 的 
长 处 和 短处 。 你 可 以 依据 各 自 组 件 运 行情 况 的 好 坏 来 评价 各 种 产品 。DBMS 的 评价 取决 于 数 
据 库 引擎 ， 数 据 字 典 ， 查 询 处 理 器 ， 报 表 编 写 器 ， 表 单 生成 器 ， 应 用 生成 器 ， 通 信和 与 集成 及 
安全 性 。 


1.4.1 数据 库 引 擎 


数据 库 引擎 是 DBMS 的 核心 ， 负 责 存储 、 获 取 和 更 新 数据 。 这 个 组 件 对 性 能 (速度 ) 和 处 
理 大 型 问题 的 能 力 ( 可 度量 性 ) 影响 最 大 。 其 他 组 件 依赖 于 引擎 来 存储 应 用 数据 和 定义 应 用 
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如 何 操作 系统 内 部 的 数据 。 图 1-3 说 明了 数据 库 引 擎 和 数据 表 的 基本 关系 。 

对 于 某 些 系统 ， 数 据 库 引擎 是 一 个 独立 的 组 件 ， 可 以 购买 并 作为 独立 的 软件 模块 使 用 。 例 
如 ，Microsoft 的 “jet engine” 构 成 了 Access 的 基础 。 类 似 地 ，Oracle 和 Microsoft SQL Server 的 
数据 库 引 擎 也 可 以 单独 购买 。 

数据 库 引擎 还 负责 强制 执行 关于 数据 的 业务 规则 。 例 如 ， 大 部 分 业务 不 允许 在 数据 库 中 使 
用 负数 价格 。 一 旦 设计 者 创建 了 那 条 规则 ， 数 据 库 引 擎 便 会 警告 用 户 并 阻止 其 输入 负 值 。 


用 户 身份 认证 
和 访问 权限 





图 1-3 数据 库 引擎 。 引 擎 负责 定义 、 存 储 和 获取 数据 。 引 擎 的 安全 子 系统 确认 
用 户 身份 认证 并 控制 对 数据 的 访问 权限 
如 图 1-4 所 示 ， 数 据 库 引擎 将 数据 存储 在 精心 设计 的 表 中 。 表 的 名 称 能 反映 表 中 存储 的 数 
据 。 列 代表 能 描述 对 象 的 简单 属性 ， 例 如 员工 的 姓名 、 电 话 号 码 和 地 址 。 每 一 行 代表 表 中 的 
一 个 对 象 。 
数据 库 性 能 是 一 个 重要 的 问题 。 应 用 的 速度 取决 于 硬件 、DBMS 软 件 、 数 据 库 设 计 和 存储 
数据 的 方式 。 第 9 章 会 讨论 提高 数据 库 应 用 性 能 的 一 些 常用 方法 ， 例 如 索引 等 。 


1.4.2 数据 字典 


数据 字典 保存 所 有 数据 表 的 定义 。 它 描述 存储 数据 的 类 型 ， 允 许 DBMS 跟 踪 数 据 ， 并 帮助 
开发 者 和 用 户 找到 他 们 需要 的 数据 。 大 部 分 现代 化 的 数据 库 系 统 将 数据 字典 作为 一 个 系统 表 
的 集合 进行 存储 。 例 如 ，Microsoft Access 将 所 有 表 的 清单 保存 在 一 个 称 为 MsysObjects 的 隐藏 


番 : Sale : Table = IX 二 SaleAnimal : Table 


Ee 8/14/2004 
10312004 
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图 1-4 Access 中 的 数据 库 表 。 表 中 存储 了 关于 一 个 业务 实体 的 数据 。 例 如 ， 
Animal 表 中 的 每 一 行 存储 关于 某 种 动物 的 数据 


系统 表 中 。Oracle 包 含 许多 系统 表 ， 它 们 由 数据 字典 提供 信息 。 例 如 ，sys.dba_tables 存 储 了 关 
于 数据 库 中 表 的 数据 。 

这 些 表 由 系统 使 用 ， 很 少 需要 直接 使 用 它们 。DBMS 会 提供 其 他 工具 帮助 你 分 析 数 据 库 的 
结构 。 例 如 ，Oracle，SQL Server，Access 和 DB2 提 供 了 一 个 管理 工具 用 于 列 出 所 有 的 表 ， 还 
提供 了 一 个 直观 的 可 视 化 工具 来 帮助 你 输入 列 名 、 选 择 数据 类 型 和 其 他 属性 。 


1.4.3 查询 处 理 器 


查询 处 理 器 是 DBMS 的 基本 组 件 。 它 使 开发 者 和 用 户 能 存储 和 获取 数据 。 在 某 些 情况 下 ， 
查询 处 理 器 是 你 与 数据 库 的 惟一 连接 。 即 ， 所 有 的 数据 库 操作 都 可 以 通过 查询 语言 来 执行 
第 4 章 和 第 5 章 将 介绍 查询 语言 的 特征 和 功能 一 一 尤其 是 标准 SQL。 

查询 来 源 于 业务 问题 。 由 于 自然 语言 诸如 英语 太 含糊 ， 不 能 够 用 于 查询 ， 因 而 查询 语言 
必 不 可 少 的。 为 了 将 通信 问题 最 小 化 ， 并 确保 DBMS 明 白 你 的 查询 ， 你 应 当 使 用 一 种 比 英语 更 
精确 的 查询 语言 。 如 图 1-5 所 示 ，DBMS 依 据 数据 字典 创建 一 个 查询 。 当 查询 运行 时 , DBMS 
的 查询 处 理 器 与 数据 库 引擎 共同 工作 来 查找 合理 的 数据 . 然后 ， 查 询 结果 格式 化 并 显示 在 界 
面 上 。 
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图 1-5 数据 库 查 询 处 理 器 。 数 据 字 典 决定 应 该 使 用 哪些 表 和 列 。 当 执行 查询 时 ， 
查询 处 理 器 与 数据 库 引 擎 通信 以 便 获取 所 需 的 数据 


1.4.4 报表 编写 器 


大 部 分 商业 用 户 希望 以 某 种 类 型 的 报表 查看 数据 汇总 。 很 多 报表 遵循 公共 的 格式 。 现 代 
化 的 报表 编写 器 允许 你 在 界面 上 建立 报表 ， 指 定 项 目 应 该 如 何 显示 或 计算 。 大 部 分 操作 可 通 
过 往 界面 上 拖 放 数据 来 完成 。 专 业 级 的 编写 器 能 让 你 在 短 时 间 内 完成 复杂 的 报表 ， 而 不 必 编 
写 任 何 代 码 。 第 6 章 将 介绍 若干 种 通用 的 商业 报表 ， 并 描述 如 何 使 用 数据 库 报表 编写 器 来 创建 
它们 。 

报表 编写 器 可 以 集成 到 DBMS 中 ， 也 可 以 作为 一 个 独立 的 应 用 ， 开 发 者 用 它 生 成 代码 ， 创 
建 所 需 的 报表 。 如 图 1-6 所 示 ， 开 发 者 创建 了 一 个 基本 的 报表 设计 。 此 设计 大 体 上 基于 一 个 查 
询 。 在 报表 生成 过 程 中 ， 报 表 编 写 器 将 查询 传递 给 查询 处 理 器 ， 后 者 与 数据 库 引擎 通信 ， 获 
取 所 需 的 数据 行 。 然 后 ， 报 表 编 写 器 依据 报表 模板 格式 化 数据 ， 并 为 报表 添加 页 码 、 页 眉 和 
页 脚 ， 完 成 整个 报表 。 

图 1-7 显 示 了 Oracle (一 个 DBMS 厂 商 ) 提供 的 报表 编写 器 ， 连 同 该 DBMS 的 表单 和 报表 工 
具 。 报 表 编 写 器 生成 的 报表 可 分 配给 其 他 用 户 使 用 。 你 可 以 设立 报表 上 的 所 有 部 分 并 从 数据 
库 中 获取 要 显示 的 数据 。 报 表 编 写 器 具有 执行 计算 和 格式 化 列 的 功能 。 你 还 可 以 控制 报表 的 
颜色 ， 在 报表 上 放置 图 片 ( 例 如 商标 )， 绘 制 线段 和 其 他 图 形 ， 使 报表 更 加 美观 或 者 引起 用 户 
对 特定 部 分 的 注意 。 


1.4.5 表单 生成 器 


表单 生成 器 或 输入 界面 帮助 开发 者 创建 输入 表单 。 如 第 6 章 所 述 ， 表 单 生成 器 的 目的 在 于 
创建 用 户 公用 的 表单 以 方便 用 户 输入 数据 。 表 单 可 以 包含 图 表 和 图 片 。 表 单 生成 器 使 开发 者 
能 在 屏幕 上 拖 放 项 目的 方式 构造 表单 。 图 1-8 说 明 要 在 表单 上 显示 数据 ， 查 询 处 理 器 起 了 很 大 
的 作用 。 
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图 1:6 数据 库 报表 编写 器 。 设 计 模 板 设 定 了 报表 的 内 容 和 布局 。 报 表 编 写 器 通 
过 查询 处 理 器 获取 所 需 数据 。 然 后 格式 化 并 打印 报表 

















图 1-7 Oracle 报 表 的 报表 编写 器 。 图 中 的 数据 模型 用 于 创建 查询 和 选择 要 显示 
的 数据 。 然 后 报表 编写 器 创建 基本 的 报表 布局 。 你 可 以 修改 设计 和 添加 
功能 来 改进 设计 或 突出 显示 某 些 部 分 











输入 表单 设计 











图 1-8 数据 库 表单 。 表 单 用 于 收集 数据 。 它 按照 符合 用 户 的 操作 来 设计 ， 方 便 
数据 输入 和 信息 查找 。 查 询 处 理 器 用 于 获取 相关 数据 并 填充 组 合 框 中 可 
供 选 择 的 数据 
很 多 数据 库 系统 还 提供 对 使 用 传统 的 、 第 三 代 语 言 (3GL) 访问 数据 库 的 支持 。 使 用 此 种 
方法 编写 程序 和 访问 数据 的 问题 将 在 第 7 章 中 介绍 。 


1.4.6 应 用 生成 器 


应 用 是 为 特定 用 户 需求 设计 的 表单 和 报表 的 集合 。 本 书 附带 的 宠物 商店 数据 库 就 是 一 个 应 
用 的 基础 ，Rolling Thunder 数 据 库 是 一 个 更 完整 的 应 用 。 应 用 可 以 很 小 ， 只 包含 若干 输入 表单 
和 报表 ， 应 用 也 可 以 是 很 大 、 很 复杂 的 系统 ， 从 包含 几 百 个 表单 和 报表 的 若干 数据 库 中 集成 
数据 。 

高 质量 的 DBMS 包 含 应 用 生成 器 ， 它 由 帮助 开发 者 创建 完整 应 用 包 的 工具 组 成 。 正 如 第 
6 章 将 讨论 的 ， 流 行 的 开发 工具 包括 菜单 和 工具 条 生成 器 以 及 一 个 完整 的 上 下 文 相关 的 帮助 


1.4.7 通信 与 集成 


有 些 数据 库 系统 提供 专门 的 通信 与 集成 工具 ， 用 于 存储 和 使 用 运行 在 不 同 计算 机 上 的 多 个 
数据 库 中 的 数据 ， 即 使 这 些 计算 机 所 处 的 地 点 不 同 。 现 代 化 的 操作 系统 和 包括 互联 网 在 内 的 
独立 网 络 使 连接 运行 在 不 同 地 点 的 数据 库 更 容易 。 尽管 如 此 ; 一 些 数据 库 系统 在 使 用 这 些 工 
具 和 提供 全 局 数据 共享 连接 上 做 得 更 加 出 色 。 

图 1-9 显 示 了 现代 化 的 DBMS 如 何 利用 附加 组 件 跨 越 通信 网 络 与 其 他 计算 机 共享 数据 。 
3GL 连 接 器 提供 了 用 传统 语言 (Visual Basic，COBOLE ,C++ 等 ) 连接 数据 库 引擎 的 方式 。 
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开发 者 既 可 以 拥有 这 些 语言 的 强大 功能 和 灵活 性 ， 还 能 够 使 用 查询 处 理 器 获取 和 存储 数据 库 
中 的 数据 。 













3GL 连 接 器 


| 


图 1-9 数据 库 组 件 。 通 信和 网 络 连 接 不 同 计算 机 上 的 数据 库 。3GL 连 接 器 使 开发 
者 能 够 使 用 传统 编程 语言 访问 数据 库 。 应 用 生成 器 用 于 建立 包含 菜单 和 
帮助 文件 的 完整 应 用 


1 


束 ES 0 
查询 处 理 器 
表单 创建 者 报表 编写 器 


应 用 生成 器 






1.4.8 安全 性 与 其 他 工具 


数据 库 的 一 个 主要 目标 是 多 用 户 共享 数据 ， 因 此 ，DBMS 必 须 负 责 建立 和 维护 安全 访问 控 
制 。 第 10 章 将 讨论 如 何 为 单个 用 户 或 用 户 组 授予 特权 ， 以 及 如 何 将 他 们 对 数据 库 的 操作 限制 
在 特定 的 范围 内 。 

对 于 运行 在 个 人 电脑 上 的 数据 库 而 言 ， 安 全 性 是 一 个 复杂 的 问题 ， 因 为 大 部 分 个 人 电脑 的 
操作 系统 只 有 很 少 的 控制 。 因 此 ，DBMS 必 须 对 安全 性 的 更 多 方面 负责 。 特 别 地 ，DBMS 必 须 
确认 用 户 ， 然 后 允许 或 限制 其 对 数据 库 的 不 同 部 分 进行 访问 。 

DBMS 提 供 了 各 种 管理 工具 ， 将 在 第 10 章 进行 讨论 。 通 常 的 功能 包括 备份 和 恢复 、 用 户 管 
理 、 数 据 存储 评价 和 性 能 监测 工具 。 


1.5 使 用 数据 库 管理 系统 的 优势 


很 多 商业 应 用 需要 相同 的 功能 (有 效 的 数据 存 取 、 多 用 户 共享 数据 、 安 全 性 等 )。 相 比 在 
每 个 应 用 程序 内 部 重新 创建 这 些 功能 ， 购 买 一 套 包含 这 些 基本 功能 的 数据 库 管理 系统 更 有 意 
义 。 这 样 开发 者 就 可 以 集中 精力 解决 业务 问题 。DBMS 的 主要 优势 如 图 1-10 所 示 。 

首先 ，DBMS 能 有 效 存 储 数据 。 正 如 第 2 章 和 第 3 章 将 要 描述 的 ， 如 果 你 依据 某 些 基 本 规则 
建立 数据 库 ， 数 据 的 存储 将 浪费 最 少 的 空间 。 另 外 ， 数 据 能 够 迅速 获取 ， 以 便 回 答 任何 查询 。 
尽管 这 两 个 目标 似乎 很 明显 ， 如 果 你 每 次 都 要 从 零 开 始 写 程序 处 理 ， 将 会 十 分 复杂 。 

DBMS 还 能 以 最 小 的 代价 维护 数据 的 一 致 性 。 当 你 定义 数据 时 ， 大 多 数 系统 允许 你 创建 基 
本 的 业务 规则 。 例 如 ， 价 格 应 始终 大 于 零 。 这 些 规则 强制 作用 于 每 一 个 表单 、 用 户 或 访问 数 
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据 的 程序 。 使 用 传统 的 方式 编程 ， 你 必须 强迫 每 个 人 遵守 相同 的 规则 。 此 外 ， 这 些 规则 放置 
在 成 千 上 万 个 不 同 程序 文件 中 一 一 这 使 得 在 业务 改变 时 ， 查 找 和 修改 变 得 十 分 困难 。 





“最 小 的 数据 元 余 


* 减轻 应 用 开发 工作 量 
“均衡 的 安全 性 、 保 密 性 和 完整 性 
* 数据 独立 性 





图 1-10 DBMS 的 优势 。 DBMS 为 数据 存 取 中 的 基本 问题 提供 解决 办 法 。 通 过 使 
用 DBMS 处 理 数据 存储 问题 ， 程 序 员 可 以 集中 精力 开发 应 用 一 一 这 样 能 
够 节约 开发 新 系统 所 需 的 时 间 和 经 费 ， 简 化 对 已 有 应 用 的 维护 


DBMS, 尤其 是 查询 语言 ,使 得 数据 集成 更 容易 。 例 如 ， 一 个 应 用 收集 关于 顾客 销售 数据 ， 
另 一 个 应 用 收集 关于 顾客 退货 数据 。 如 果 程 序 员 创 建 不 同 的 程序 和 文件 存储 这 些 数 据 ， 合 并 
数据 将 会 十 分 困难 的 。 相 反 地 ， 如 果 使 用 DBMS ， 数 据 库 中 的 任何 数据 都 可 以 方便 地 获取 、 合 
并 和 使 用 查询 系统 进行 比较 。 


1.5.1 集中 精力 于 数据 


使 用 原始 的 程序 文件 方法 时 ， 开 发 者 将 精力 集中 于 过 程 和 程序 上 。 开 发 者 在 启动 一 个 项 目 
时 首先 会 问 这 样 的 问题 :程序 应 该 如 何 组 织 ? 需要 进 
行 哪些 计算 ? 而 数据 库 方法 将 精力 集中 于 数据 上 。 开 
发 者 现在 启动 项 目 时 会 问 : 需要 收集 哪些 数据 ? 这 种 
改变 不 仅仅 是 技术 性 的 。 它 改变 了 整个 开发 过 程 。 

花 一 点 时 间 考 虑 一 下 开发 过 程 。 哪 个 部 分 最 常 改 
变 : 程序 (表单 和 报表 ) 还 是 数据 ? 对， 公司 随时 都 
在 收集 新 数据 ， 而 数据 的 结构 是 不 常 改变 的 。 当 它 确实 
要 改变 时 ， 通 常 是 由 于 你 要 添加 新 的 元 素 一 比如 手机 
号 码 。 另 一 方面 ， 用 户 需 要 经 常 对 表单 和 报表 进行 修改 。 

如 图 1-11 所 示 ， 数 据 库 方法 将 精力 集中 在 数据 上 。 
DBMS 负 责 定义 、 存 储 和 获取 数据 。 所 有 的 数据 请 求 图 | 11 DBMS 将 精力 集中 让 在 数据 上 。 








都 必须 经 过 数据 库 引 擎 。 因 此 ，DBMS 负 责 数 据 的 有 首先 ， 定 义 数 据 。 然 后 所 有 的 查 
效 存 取 、 并 发 性 、 数 据 安 全 性 等 等 。 精 心 定义 数据 结 询 、 报 表 和 程序 都 要 通过 DBMS 
构 之 后 ， 附 加 的 五 具 诸如 报表 编写 器 、 表 单 生成 器 和 访问 数据 。 通 常 DBMS 处 理 诸如 
查询 语言 会 使 商业 应 用 的 开发 更 方便 和 快捷 。 人 
1.5.2 ”数据 独立 性 


将 精力 集中 于 数据 的 另外 一 个 重要 特征 是 将 数据 定义 从 程序 中 分 离 出 来 一 即 数据 独立 
性 。 数 据 独立 性 使 你 能 改变 数据 定义 而 不 必修 改 程序 。 类 似 地 ， 数 据 可 以 转移 到 新 硬件 或 一 
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台 完 全 不 同 的 计算 机 上 。 只 要 DBMS 知 道 如 何 访问 数据 ， 就 不 必 改 变 表单 、 报 表 或 使 用 那些 数 
据 的 程序 。 可 以 修改 独立 的 程序 而 不 必 改变 数据 定义 。 

这 种 理想 主义 的 描述 有 一 些 例外 情况 。 显 然 ， 如 果 删 除了 整个 数据 库 结 构 ， 那 么 部 分 应 用 
程序 将 不 会 正常 工作 。 同 样 ， 如 果 对 数据 定义 做 了 根本 的 改变 一 一 比如 将 电话 号 码 的 存储 类 型 





从 数值 类 型 改 为 文本 类 型 一 -你 可 能 必须 修改 报表 和 表单 。 然 而 ， 一 个 合理 设计 的 数据 库 很 少 
需要 这 种 根本 的 改变 。 

考虑 向 Employee 表 中 添加 手机 号 码 。 图 1-12 显 示 了 员工 表 的 部 分 数据 定义 。 无 论 存在 多 少 
表单 、 报 表 或 程序 ， 步 骤 是 相同 的 。 只 需 简 - 
单 地 在 表 定 义 中 插入 手机 号 码 字段 Eee Ne Anambal 
CellPhone。 已 有 的 查询 、 表 单 、 报 表 和 程序 TaxpayerlD Text Federal ID 


会 和 以 前 一 样 正 常 运行 。 当 然 ， 它 们 会 忽略 LastName Text 
这 个 新 增加 的 手机 号 码 字段 。 如 果 你 想 在 报 “| “rstName Text 
表 上 看 到 这 个 新 字段 的 值 ， 你 得 添加 它 。 对 | phone Text 
于 新 型 的 报表 编写 器 来 说 ， 这 种 修改 可 能 简 





CellPhone Text Cellular . . . 








单 到 只 需 将 手机 号 码 字 段 CellPhone 拖 放 到 表 

单 或 报表 的 适当 位 置 。 图 1-12 向 Employee 表 中 添加 手机 号 码 字 段 。 向 表 
将 注意 力 集中 于 数据 和 精心 的 设计 能 够 中 添加 新 元 素 不 会 影响 已 有 的 查询 、 报 表 、 

避免 在 传统 程序 文件 方法 中 遇 到 的 问题 。 将 表单 或 程序 


公共 数据 库 的 方法 合并 到 一 个 应 用 中 使 得 专家 能 够 创建 功能 强大 的 数据 库 管理 系统 ， 也 使 得 
应 用 程序 员 不 必 集 中 精力 建立 解决 商业 问题 的 应 用 。 


1.5.3 数据 独立 性 与 客户 /服务 器 系统 


过 去 10 年 间 开 发 的 不 断 强大 的 个 人 计算 机 开辟 了 很 多 设计 和 建立 商业 应 用 的 新 方法 。 其 
中 最 重要 的 是 客户 /服务 器 模型 。 数 据 库 管理 系统 在 创建 客户 /服务 器 系统 中 起 到 了 重要 作用 。 
在 一 个 客户 /服务 器 的 例子 中 ， 数 据 存储 在 一 台中 央 计 算 机 的 DBMS 中 。 分 散 的 个 人 计算 机 运 
行 一 个 前 端 应 用 ， 从 服务 器 获取 并 显示 数据 。 

数据 独立 性 的 能 力 在 于 客户 端 应 用 本 质 上 独立 于 数据 库 。 开 发 者 不 必修 改 数据 库 就 能 创建 
新 的 应 用 。 同 样 ， 他 们 也 可 以 扩充 数据 库 甚至 将 其 转移 到 多 个 服务 器 上 ， 而 不 必修 改 应 用 程 
序 。 用 户 仍 旧 使 用 他 们 所 熟悉 的 个 人 计算 机 应 用 。 开 发 者 保持 对 数据 的 控制 。 为 了 保护 数据 
DBMS 可 以 监测 并 强制 安全 性 和 完整 性 条 件 ， 而 仍然 赋予 授权 用 户 访问 权限 。 第 10 章 将 更 详细 
地 讨论 分 布 式 数据 库 系 统 的 使 用 ， 包 括 在 万 维 网 上 构建 客户 /服务 器 系统 。 


1.6 重要 的 商用 数据 库 


重要 的 数据 库 系统 包括 DB2、Oracle、CA-Ingres、SQL Server 和 Informix。IBM、Oracle 
和 CA-Ingres 提 供 可 用 于 不 同 平台 的 工具 ， 从 大 型 、 中 型 到 个 人 计算 机 。Informix 数 据 库 系统 
还 支持 各 种 硬件 平台 ， 但 它 主要 运行 在 UNIX 操 作 系统 的 计算 机 上 。 很 多 数据 库 包 可 供 个 人 计 
算 机 使 用 ， 但 大 部 分 生产 厂商 将 其 限制 在 开发 小 型 应 用 上 。Microsoft Access 是 一 个 小 型 系统 
数据 库 的 普通 例子 ， 而 Microsoft 还 提供 了 一 个 SQL Server 的 低 价 版 本 ， 称 为 MSDE。MSDE 
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提供 与 SQL Server 相 同 的 功能 ， 但 它 仅 限 五 个 用 户 。Oracle 提 供 了 单机 使 用 的 Personal 
Oracle 。 

选择 数据 库 系 统 可 能 会 是 一 个 难题 。 很 多 大 型 企业 统一 使 用 某 一 厂商 的 产品 ， 通 过 谈判 降 
低 许 可 证 的 价格 ， 并 使 之 能 够 用 于 企业 内 的 所 有 项 目 中 。 然 而 ， 如 果 你 需要 为 某 一 特定 项 目 
选取 DBMS ， 你 需要 仔细 调研 确定 厂商 。 

重要 的 数据 库 系 统 可 用 于 大 型 项 目 ， 它 们 提供 对 数 千 种 精细 功能 的 众多 选项 和 控制 。 然 
而 ， 这 些 选 项 对 于 要 理解 数据 库 主要 概念 的 初学 者 来 说 是 很 复杂 的 。 对 于 初学 者 ， 最 好 从 简 
单一 些 的 数据 库 系统 开始 学 习 ， 例 如 Microsoft Access。 在 结构 上 ，Access 与 大 型 数据 库 相似 : 
可 以 很 容易 地 随时 改变 数据 库 设计 ， 它 有 帮助 建立 表单 和 报表 的 向 导 ， 而 且 SQL 查 询 遵守 绝 大 
部 分 SQL-92 标 准 ， 相 对 便宜 并 且 使 用 广泛 。 然 而 ，Microsoft 推 荐 说 只 应 在 相对 小 型 的 、 狼 立 
的 应 用 中 使 用 Access。 要 获得 更 优 的 性 能 、 安 全 性 和 数据 保护 ， 你 总 归 要 使 用 一 个 更 强大 的 数 
据 库 系统 。 


1.7 数据 库 管理 系统 简 史 


开发 者 们 很 快意 识 到 ， 很 多 商业 应 用 需要 一 个 用 于 共享 数据 的 通用 功能 集合 ， 因 而 ， 他 们 
开始 开发 数据 库 管 理 系统 。 开 发 者 们 逐渐 提炼 目标 并 提高 编程 技术 。 很 多 早期 的 数据 库 方法 
依然 有 用 ， 部 分 原因 是 因为 很 难 抛弃 目前 能 正常 运行 的 应 用 。 理 解 这 些 老 的 方法 之 间 的 基本 
区 别 是 有 意义 的 。 下 面 的 讨论 简化 了 相关 概念 并 且 忽 略 了 细节 。 共 目的 在 于 强调 各 种 数据 库 
系统 之 间 的 多 别 一 一 而 不 是 教 你 如 何 设计 或 使 用 它们 。 

最 早 的 数据 库 管理 系统 基于 存储 数据 的 层次 方法 ， 它 们 是 COBOL 文 件 结构 的 扩展 。 为 了 
提供 灵活 的 访问 ， 这 些 系统 扩展 为 网 状 数据 库 。 然 而 ，E. F. Codd 发 明 的 关系 数据 库 方法 最 终 
成 为 处 于 统治 地 位 的 数据 存 取 方 法 。 最 近 ， 出 现 了 面向 对 象 方法 。 从 某 种 角度 来 说 ， 它 是 关 
系 模 型 的 扩展 ， 从 其 他 角度 来 看 ， 它 又 是 不 同 的 。 然 而 ， 由 于 它 刚刚 出 现 ， 以 此 概念 为 基础 
的 系统 还 在 发 展 之 中 。 


1.7.1 层次 数据 库 


层次 数据 库 方法 认为 业务 数据 一 般 表现 出 一 种 分 层 的 关系 。 例 如 ， 在 一 个 没有 电脑 的 小 办 
公 室 里， 数据 可 能 会 存放 在 档案 柜 中 。 档 案 柜 可 以 按 顾客 来 组 织 。 每 一 个 顾客 部 分 包含 存放 
个 人 订单 的 文件 夹 ， 这 些 订单 列 出 该 顾客 购买 的 每 一 件 商品 。 要 存 取 数据 ,数据库 系统 必须 
从 顶端 开始 一 一 在 此 例 中 是 某 个 顾客 。 如 图 1-13 所 示 ， 当 数据 库存 储 顾 客 数据 时 ， 它 同时 存储 
了 其 他 相关 的 层次 信息 。 

层次 数据 库 方法 是 相对 快速 的 一 一 如 果 你 只 想 从 顶端 开始 访问 数据 。 与 数据 存储 相关 的 最 
严重 的 问题 是 ， 搜 索 位 于 层次 结构 底部 或 中 部 的 数据 项 十 分 困难 。 例 如 ， 要 查找 订购 了 特定 
商品 的 所 有 顾客 ， 数 据 库 将 必须 检查 每 个 顾客 ， 每 个 订单 以 及 订单 上 的 每 件 商品 。 


1.7.2 网 状 数据 库 


网 状 数据 库 与 物理 网 络 〈 例 如， 局域网 ) 无 关 。 相 反 ， 网 络 模型 的 命名 来 源 于 数据 元 素 之 
间 的 关系 网 。 网 络 模 型 的 主要 目的 在 于 解决 层次 模型 中 从 不 同 角 度 搜索 数据 的 问题 。 
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图 1-14 说 明 在 一 个 网 络 模型 中 顾客 、 订 单 和 商品 的 数据 组 成 。 首 先 ， 应 注意 现在 各 个 项 是 
物理 分 离 的 。 其 次 ， 要 注意 它们 以 箭头 相连 接 。 最 后 ,注意 入 口 点 ， 它 们 用 箭头 指示 。 入 口 
点 是 预先 定义 的 可 以 被 搜索 的 项 。 箭 头 的 用 途 是 表示 一 旦 你 进入 了 数据 库 ，DBMS 就 能 够 沿 着 
箭头 进行 搜索 并 显示 匹配 的 数据 。 只 要 图 中 有 一 个 箭头 ， 数 据 库 就 能 建立 一 个 有 效 的 连接 。 





图 1-13 层次 数据 库 。DBMS 从 顶端 (顾客 ) 开 ”图 1-14 网 状 数据 库 。 所 有 数据 集 必 须 以 索引 相 


始 获取 数据 。 获 取 了 一 个 顾客 后 ， 接 着 连接 ， 如 箭头 所 示 。 同 样 地 ， 所 有 人 和 人口 
获取 所 有 侈 套 的 数据 〈 订 单 ， 然 后 是 订 点 (一 个 查询 的 起 点 ) 必须 在 解答 问题 
购 的 商品 ) 前 定义 和 创建 


尽管 这 种 方法 似乎 解决 了 搜索 问题 ， 但 代价 很 高 。 所 有 的 箭头 必须 以 索引 或 内 企 指 针 的 方 
式 进行 物理 实现 。 本 质 上 ， 索 引 复制 了 关联 数据 集合 中 的 每 个 关键 数据 项 ， 并 将 其 与 指向 数 
据 其 余部 分 存储 位 置 的 指针 相关 联 。 网 状 数据 库 方法 的 问题 在 于 索引 必须 在 用 户 进行 查询 前 
建立 。 因 此 ， 开 发 者 必须 预测 用 户 可 能 提出 的 每 一 个 关于 数据 的 问题 。 更 糟 的 是 ， 建 立 和 维 
护 索引 可 能 需要 大 量 的 处 理 器 时 间 和 存储 空间 。 


1.7.3 关系 数据 库 


E. F. Codd 于 20 世 纪 70 年 代 创建 了 关系 数据 库 方 法 ， 几 年 之 内 ， 在 三 个 因素 的 共同 作用 下 ， 
关系 数据 库 成 为 数据 存储 的 主要 方法 。 首 先 ， 理论 家 定义 了 基本 概念 并 阐明 了 优点 。 第 二 ， 
建立 数据 库 管理 系统 软件 的 程序 员 创 建 了 有 效 的 组 件 。 第 三 ， 硬 件 性 能 的 提高 满足 了 系统 不 
断 增 长 的 要 求 。 : 

图 1-15 说 明 例子 中 的 四 个 基本 表 在 关系 数据 库 中 是 如 何 表示 的 。 关 键 在 于 表 (Codd 称 其 
为 “关系 ”) 是 数据 的 集合 。 每 张 表 将 属性 存储 在 列 中 ， 列 描述 了 特定 的 实体 。 这 些 数 据 表 不 
在 物理 上 相互 连接 。 连 接 通过 每 张 表 中 存储 的 相 匹 配 的 数据 来 表示 。 例 如 ，Order 表 包含 
CustomerID 列 。 如 果 你 找到 一 笔 CustomerID 为 15 的 订单 ， 数 据 库 就 自动 找到 匹配 的 
CustomerID 并 获取 相关 的 顾客 数据 。 

关系 数据 库 方 法 的 作用 在 于 设计 者 不 必 了 解 用 户 会 对 数据 提出 哪些 问题 。 如 果 数 据 是 精心 
定义 的 〈 参 见 第 2 章 和 第 3 章 ) ， 数 据 库 能 有 效 地 回答 几乎 所 有 的 问题 (参见 第 4 章 和 第 5 章 )。 
这 种 灵活 性 和 有 效 性 是 关系 模型 处 于 统治 地 位 的 主要 原因 。 本 书 的 绝 大 部 分 集中 使 用 关系 数 
据 库 建立 应 用 。 


Customer (CustomerID, Name, 


Order (OrderID, CustomerID, CE 
ItemsOrdered(OrderID， ItemID, Quantity, 
Items (ItemID, Description, Price, 





图 1-15 关系 数据 库 。 数 据 存储 在 分 离 的 数据 集合 中 。 所 有 表 在 物理 上 并 未 相 
连 ， 相 反 ， 数 据 在 列 之 间 连 接 。 例 如 ， 当 获取 一 个 订单 时 ， 数 据 库 可 
以 依据 CustomerID 匹 配 并 获取 对 应 的 顾客 数据 


1.7.4 面向 对 象 数据 库 


面向 对 象 (OO) 数据 库 是 一 种 新 型 的 、 发 展 中 的 组 织 数据 的 方法 。 面 向 对 象 方法 起 源 于 
一 种 创建 程序 的 新 方法 。 其 目的 在 于 定义 能 在 很 多 程序 中 重用 的 对 象 一 这 样 可 以 节约 时 间 并 
减少 错误 。 如 图 1-16 所 示 ， 一 个 对 象 主要 有 三 个 部 分 : 名 称 、 特 性 或 属性 的 集合 和 方法 或 函数 
的 集合 。 属 性 用 来 描述 对 象 ， 就 像 关系 数据 库 中 用 属性 描述 实体 一 样 。“ 方 法 ”是 面向 对 象 方 
法 的 真正 创新 。 方 法 是 定义 每 个 对 象 可 执行 操作 的 简短 程序 。 例 如 ， 添 加 新 顾客 的 代码 可 以 
存储 在 Customer 对 象 中 。 这 里 的 创新 在 于 这 些 方 法 可 以 存储 在 对 象 定义 中 。 

图 1-16 同 样 暗示 了 面向 对 象 方法 的 能 力 。 注 意 ， 基 本 对 象 (Order、Customer、Orderltem 
和 Item) 与 关系 数据 库 方法 中 的 一 致 。 然 而 ， 有 了 面向 对 象 方法 ， 新 对 象 可 以 根据 已 有 对 象 来 
定义 。 例 如 ， 公 司 可 以 创建 不 同类 别 的 顾客 ， 如 商业 账户 和 政府 账户 。 这 些 新 对 象 可 以 包含 
原始 Customer 对 象 所 有 的 属性 和 方法 ， 并 且 还 可 以 添加 只 适用 于 新 类 型 顾客 的 变量 。 

面向 对 象 方法 从 根本 上 改变 了 程序 员 创 建 应 用 的 方法 。 作 为 一 个 应 用 开发 者 ， 你 将 使 用 由 
面向 对 象 方法 创建 的 DBMS 软 件 。 这 样 ， 你 就 能 使 用 已 经 定义 好 的 对 象 、 属 性 和 方法 。 

处 理 真 正 的 面向 对 象 数据 有 两 种 基本 方法 : (1) 扩展 关系 模型 以 便 能 够 处 理 典型 的 面向 
对 象 的 功能 要 求 ， 或 者 〈2) 创建 新 型 的 面向 对 象 的 DBMS 。 现 在 ， 大 部 分 成 功 的 商业 数据 库 
系统 都 遵循 第 一 种 方法 ， 向 关系 模型 添加 对 象 功能 。 





图 1-16 面向 对 象 的 数据 库 。 对 象 具 有 属性 (就 像 关系 实体 具有 属性 一 样 )， 它 
拥有 描述 该 对 象 的 数据 。 对 象 具 有 方法 ， 即 该 对 象 能 够 执行 的 功能 。 
对 象 可 以 从 其 他 对 象 继承 
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美国 国家 标准 化 组 织 (ANSI) 为 向 关系 模型 中 添加 面向 对 象 功能 的 方法 提供 了 最 好 的 示 
范 。 面 向 对 象 功 能 是 SQL99 版 本 的 一 个 主要 部 分 。SQL200x 标 准 的 提议 中 也 阐明 了 部 分 面向 对 
象 问题 。1997 年 ，SQL3 开 发 小 组 与 对 象 数据 库 管理 组 织 (ODMG) 合并 。 有 三 个 功能 建议 增 
加 面向 对 象 的 能 力 : (1) 抽象 数据 类 型 ，(2) 子 表 和 (3) 持久 存储 模块 。 数 据 库 管理 系统 厂 
商 已 经 实现 了 其 中 的 部 分 功能 ， 以 及 一 些 更 先进 的 功能 。 

1. 对 象 属性 

第 一 个 问题 包括 定义 和 存储 属性 。 特 别 地 ， 面 向 对 象 程序 员 需 要 能 够 创造 新 的 复合 属性 ， 
这 些 复 合 属性 由 其 他 数据 类 型 构成 。SQL 支 持 抽象 数据 类 型 ， 使 开发 者 能 够 继承 已 有 类 型 来 创 
建新 的 数据 类 型 。 这 种 技术 支持 属性 的 继承 。 存 储 在 某 列 的 数据 类 型 可 以 是 几 种 已 有 抽象 类 
型 的 复合 。 考 虑 图 1-17， 其 中 显示 了 某 地 理 信 息 系 统 (GIS) 的 部 分 数据 库 。GIS 定 义 了 根据 
纬度 、 经 度 和 海拔 表示 方位 的 一 种 抽象 数据 类 型 。 同 样 地 ， 一 条 线段 〈 例 如 国界 ) 就 是 这 些 
方位 点 的 集合 。 通 过 将 数据 存储 在 表 中 ， 应 用 可 以 依据 用 户 需 求 搜索 和 获取 信息 。 数 据 库 还 
为 共享 和 更 新 数据 提供 了 方便 。 在 GIS 示 例 中 ， 数 据 库 处 理 选择 条 件 (Region=Europe)。 数 据 
库 还 能 匹配 并 获取 储存 在 其 他 表 中 的 人 口 统计 学 数据 。 这 种 方法 的 优点 在 于 ，DBMS 负 责 处 理 
数据 的 存储 和 获取 ， 使 开发 者 不 必 将 精力 集中 于 应 用 细节 。 





图 1-17 抽象 数据 类 型 或 对 象 。 一 个 地 理 信息 系统 需要 储存 和 共享 复杂 的 数据 
类 型 。 例 如 ， 区 域 由 地 理 线段 定义 。 每 条 线段 是 点 的 集合 ， 点 由 纬度 、 
经 度 和 海拔 定义 。 使 用 数据 库 能 简化 查找 和 共享 数据 


抽象 数据 类 型 使 开发 者 能 够 创建 和 存储 应 用 所 需 的 任何 数据 。 抽 象 数据 类 型 还 能 为 应 用 开 
发 提供 更 强 的 控制 能 力 。 首 先 ， 在 DBMS 中 存储 数据 能 将 所 有 开发 者 访问 数据 的 方法 简化 、 标 
准 化 。 第 二 ， 数 据 类 型 内 部 的 元 素 可 以 被 封装 。 通 过 将 元 素 定义 为 私有 的 ， 应 用 开发 者 (和 
用 户 ) 只 能 通过 预定 义 的 过 程 访 问 内 部 元 素 。 例 如 ， 通 过 将 元 素 定义 为 私有 的 ， 可 以 避免 开 
发 者 直接 修改 任何 方位 的 经 度 和 纬度 坐标 。 

SQL 提 供 了 另 一 种 处 理 继承 的 方法 ， 通 过 定义 子 表 来 实现 。 子 表 继 承 了 基本 表 的 所 有 列 ， 
提供 类 似 于 抽象 数据 类 型 的 继承 ， 但 是 ， 所 有 数据 存储 在 不 同 的 列 中 。 这 种 技术 与 图 1-16 中 所 
示 方 法 类 似 ， 将 子 类 存储 在 不 同 的 表 中 。 不 同 的 是 ， 面 向 对 象 子 表 不 必 包 含 主 码 。 如 图 1-18 所 
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示 ， 继 承 由 UNDER 语 句 指定 。 从 定义 最 高 层级 的 表 (例如 Customer) 开始 ， 当 你 创建 一 个 新 
表 (例如 CommercialCustomer) 时 ， 可 以 通过 添加 UNDER 语 句 指 定 它 是 一 个 子 表 。 如 果 你 使 
用 统一 建 模 语言 (UML) 的 三 角形 指针 符号 标记 继承 ， 在 SQL 中 创建 表 将 会 很 容易 。 如 果 图 
中 有 一 个 “指针 ”指向 另 一 张 表 ， 只 需 定义 表 的 属性 并 添加 一 个 UNDER 语 句 即 可 。 


CREATE SET TABLE Customer 


CustomeriD INTEGER, 

Address VARCHAR, 

Phone CHAR(15) 
) 


CREATE SET TABLE CommercialCustomer 从 Customer 表 
( 


继承 列 


Contact VARCHAR, 
hp ee NUMERIC(5,2) 
UNDER Customer; 





图 1-18 SQL 子 表 。 子 表 继 承 所 选 基 本 表 的 列 。 对 CommercialCustomer 表 的 查 
询 也 会 从 CustomerID、Address 和 Phone 列 获取 数据 ， 这 些 列 是 从 
Customer 表 继承 的 


不 必 担 心 CREATE TABLE 命 令 的 细节 。 相 反 ， 明白 抽象 数据 类 型 与 子 表 之 间 的 区 别 是 很 
重要 的 。 抽 象 数 据 类 型 用 于 设置 存储 于 某 一 列 的 数据 的 类 型 。 有 了 复杂 数据 类 型 ， 很 多 数据 
(纬度 、 经 度 等 ) 将 会 存储 于 单独 的 列 中 。 对 于 子 表 ， 高 层 的 数据 项 仍 保留 在 不 同 的 列 中 。 例 
如 ，CommercialCustomer 子 表 可 以 从 Customer 基 本 表 继 承 。Customer 表 定义 的 所 有 属性 作为 不 
同 的 列 对 于 CommercialCustomer 都 是 有 效 的 。 

2. 对 象 方法 

每 种 抽象 数据 类 型 还 可 以 有 方法 或 函数 。 在 SQL 中 ， 例 程 称 为 持久 存储 模块 。 它 们 可 以 写 
成 SQL 语 句 的 形式 。SQL 语 言 也 在 扩充 编程 命令 一 一 很 像 Oracle 的 PL/SQL 扩 充 。 例 程 有 多 种 用 
途 。 它 能 支持 触发 器 ， 这 已 经 在 SQL 中 实现 。 持 久 例 程 也 能 用 作 抽 象 数据 类 型 的 方法 。 设 计 者 
可 以 定义 适用 于 特定 数据 类 型 的 函数 。 例 如 ，GIS 方 位 数据 类 型 可 以 使 用 减 运算 符 ， 表 示 计 算 
两 点 之 间 的 距离 。 

为 了 利用 数据 库 的 能 力 ， 每 种 抽象 数据 类 型 应 当 定义 两 个 特殊 功能 : 〈1) 检测 两 元 素 的 
等 价 性 ，(2) 比较 元 素 ， 以 便 排序 。 这 些 功 能 使 DBMS 能 够 搜索 和 排列 数据 。 这 些 功 能 可 能 不 
适用 于 某 些 数 据 类 型 (例如 ， 声 音 片断 )， 但 只 要 可 能 就 应 当 定义 它们 。 

3. 面向 对 象 语言 和 共享 持久 对 象 

”面向 对 象 程序 员 习 惯 在 内 存 中 创建 他 们 自己 的 对 象 ， 因 此 ， 他 们 需要 一 种 方法 来 存储 和 共 
享 这 些 对 象 ， 开 发 纯 OODBMS 模 型 正 是 为 了 解决 这 种 问题 。 尽 管 目标 看 起 来 可 能 与 改进 的 关 
系 方法 很 相似 ， 但 产生 的 数据 库 系统 却 是 独特 的 。 

大 部 分 面向 对 象 开发 是 从 编程 语言 发 展 而 来 的 。 有 些 语 言 为 了 利用 面向 对 象 的 特性 进行 了 

专门 设计 。 一 般 的 例子 如 C++、Smalltalk 和 Java。 这 些 语 言 中 的 数据 变量 被 定义 为 对 象 。 每 个 





类 定义 了 属性 和 方法 。 现 在 ， 开 发 者 使 用 这 些 语言 建立 应 用 ， 必 须 创 建 自己 的 存储 机 制 ， 或 
者 将 内 部 数据 转 到 关系 数据 库 中 。 

复杂 的 对 象 很 难 在 关系 数据 库 中 存储 。 大 部 分 语言 提供 了 从 文件 存 取 数据 的 便捷 手段 ， 但 
对 数据 库 的 支持 很 少 。 例 如 ，C++ 库 具有 直接 将 对 象 串 行 化 为 磁盘 文件 的 函数 ， 这 种 手段 有 两 
个 基本 问题 : (1) 搜索 文件 或 从 不 同 对 象 中 匹配 数据 十 分 困难 ，(2) 开发 者 应 负责 创建 所 有 
共享 、 并 发 以 及 安全 操作 。 由 于 数据 在 本 质 上 依赖 于 程序 并 且 不 再 独立 ， 这 种 方法 引起 了 很 
多 问题 。 

本 质 上 , 面向 对 象 程序 员 需 要 创建 持久 对 象 ， 即 对 象 可 以 在 任何 时 候 保 存 和 获取 。 理想 地 ， 
数据 库 会 使 定义 标准 化 ， 控 制 数据 共享 ， 并 提供 搜索 与 合并 数据 的 例 程 。 最 根本 的 困难 在 于 
没有 标准 理论 用 于 解释 如 何 完成 这 些 任 务 。 然 而 ， 如 图 1-19 所 示 ， 已 有 很 多 OODBMS ， 并 且 
据说 用 户 已 经 用 这 些 工具 创建 了 很 多 成 功 的 
应 用 。 

OODBMS 的 关键 之 处 在 于 ， 对 于 程序 员 
来 说 它 看 起 来 只 是 简单 的 存储 扩展 。 无 论 对 
象 存 储 在 RAM 还 是 通过 DBMS 共 享 ， 对 象 及 
其 关联 的 链接 处 理 是 一 样 的 。 很 显然 ， 这 些 
系统 使 面向 对 象 程序 员 开 发 起 来 更 方便 。 问 
题 是 ， 要 使 用 这 个 系统 ， 你 得 是 一 个 面向 对 
象 程 序 员 。 换 句 话说， 如 果 你 一 开始 就 关注 
面向 对 象 编程 ， 那 么 真正 的 OODBMS 可 能 很 
有 用 。 如 果 你 最 初 使 用 传统 的 关系 数据 库 ， 、 
那么 使 用 一 个 添加 了 面向 对 象 功 能 的 关系 ”图 1-19 OODBMS 厂 商 及 其 产品 。 每 个 工具 都 有 不 
DBMS 可 能 会 更 好 。 - 同 的 功能 和 作用 。 可 以 与 厂商 联系 以 获取 详 

理论 上 ，1997 年 ANSI 与 ODMG 签 定 的 协 细 信 息 或 在 网 上 搜索 用 户 评论 
定 使 SQL 和 OODBMS 模 型 更 接近 于 一 个 联合 的 标准 。 实 际 上 ， 在 商界 可 能 需要 儿 年 并 要 进行 
相当 多 的 实践 。 目 前 ， 如 果 你 对 存储 和 共享 数据 很 关注 ， 那 么 要 依据 你 初始 的 兴趣 进行 选择 : 
面向 对 象 编程 还 是 关系 数据 库 。 


1.8 应 用 开发 


如 果 你 仔细 研究 了 图 1-14、 图 1-15 和 图 1-16， 你 会 注意 到 他 们 实际 上 都 有 相同 的 数据 集 。 
这 种 相似 不 是 偶然 。 应 当 继 续 学 习 第 2 章 和 第 3 章 介 绍 的 数据 库 设 计 方法 ， 而 不 必 关 心 实现 数 
据 库 的 方法 。 换 句 话说， 任何 数据 库 项 目 都 开始 于 确认 所 需 数据 和 分 析 数 据 以 尽 可 能 高 效 地 

建立 应 用 的 第 二 步 是 确定 用 户 需要 的 表单 和 报表 。 查 询 是 这 些 表单 和 报表 的 基础 ， 所 以 正 
如 第 4 章 和 第 5 章 将 要 介绍 的 ， 必 须 创 建生 成 表单 和 报表 所 需 的 任何 查询 或 视图 。 然 后 使 用 报 
表 编 写 器 和 表单 生成 器 创建 每 个 报表 和 表单 ， 如 第 6 章 所 述 。 下 一 步 是 将 表单 和 报表 合并 到 应 
用 中 ， 应 用 处 理 用 户 所 需 的 所 有 操作 : 总 的 目标 是 创建 符合 用 户 工作 要 求 的 应 用 来 帮助 他 们 
完成 工作 。 
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第 7 章 讲述 如 何 处 理 多 用 户 环境 下 的 普遍 问题 : 保护 数据 完整 性 和 支持 事务 。 第 8 章 介绍 
另 一 种 存储 数据 的 设计 方法 : 数据 仓库 。 对 于 大 型 数据 库 ， 事 务 处 理 系统 使 用 索引 和 其 他 功 
能 来 优化 存储 任务 。 现 在 ， 管 理 者 想 获 取 和 分 析 数 据 。 数 据 仓库 提供 了 特殊 设计 和 工具 以 支 
持 联 机 分 析 处 理 (OLAP)。 

当 应 用 设计 完成 和 开始 使 用 时 ， 需 要 执行 一 些 数 据 库 管 理 任务 。 设 置 安全 参数 和 数据 的 访 
问 控制 是 一 项 更 重要 的 任务 。 第 9 章 讨论 各 种 管理 和 安全 问题 。 

随 着 企业 的 扩大 ， 计 算 机 系统 和 应 用 变 得 更 加 复杂 。 现 代 企 业 里 的 一 个 重要 特点 是 用 户 需 
要 通过 整个 企业 内 部 的 不 同 计算 机 访问 和 使 用 数据 。 某 些 场合 需要 扩大 你 的 应 用 范围 ， 以 便 
更 多 的 人 从 不 同 地 点 使 用 它 。 第 10 章 讨论 的 分 布 式 数据 库 是 一 种 创建 设 有 地 域 限 制 的 应 用 的 
强大 方法 。 互 联网 迅速 成 为 一 种 强大 的 工具 ， 用 于 建立 和 实现 世界 上 任何 人 都 能 使 用 的 数据 
库 应 用 。 同 样 的 技术 也 可 用 于 建立 仅 允 许 内 部 职员 访问 的 应 用 。 那 些 使 用 互联 网 技术 但 仅 限 
内 部 人 员 访 问 的 系统 称 为 内 联网 (intranets)。 


1.9 Sally 的 宠物 商店 


一 位 喜爱 小 动物 的 年 轻 女 士 Sally 开 了 一 家 新 型 宠物 商店 。Sally 希 望 能 为 宠物 们 找到 细心 昭 
顾 它们 的 主人 。 她 的 主要 目标 之 一 是 严格 监督 饲养 入， 以 确保 他 们 细心 照顾 所 有 动物 。 小 动物 
得 到 适当 的 照顾 才 会 变 成 温顺 的 宠物 。 第 二 个 目标 是 开拓 与 顾客 们 的 长 期 关系 。 她 想 帮助 顾客 
在 各 种 情况 下 都 能 选择 最 优 品种 的 动物 ， 并 且 确 保 顾 客 具有 照顾 好 动物 所 需 的 所 有 支持 和 信息 。 

Sally 认 识 到 要 实现 这 两 个 目标 需要 收集 和 管理 大 量 的 数据 。 在 参加 了 MBA 课 程 中 的 信息 
系统 课程 之 后 ， 她 认识 到 需要 数据 库 来 帮助 自己 收集 数据 和 管理 宠物 商店 的 经 营 。 

当前 Sally 只 有 一 个 商店 ， 但 她 渴望 能 扩展 到 其 他 城市 。 她 想 将 雇佣 的 员工 培训 为 “动物 
的 朋友 ”， 而 不 是 销售 人 员 。 这 些 员工 能 帮助 顾客 选择 合适 的 动物 ， 能 回答 有 关 完 物 健康 、 营 
养 和 习性 的 问题 。 他 们 甚至 会 说 服 某 些 顾 客 不 要 购买 动物 。 

由 于 员工 会 将 他 们 的 大 部 分 时 间 花 在 顾客 和 动物 上 ， 他 们 需要 技术 来 帮助 他 们 完成 任务 。 
这 个 新 系统 必须 容易 使 用 ， 因 为 用 于 计算 机 培训 的 时 间 很 少 。 

在 与 Sally 进 行 了 几 次 简短 讨论 之 后 ， 很 明显 她 的 系统 需要 花费 时 间 进 行 建立 和 测试 。 幸 
运 的 是 ，Sally 表 示 她 并 不 需要 立刻 完成 整个 系统 。 她 首先 需要 一 个 基本 的 系统 处 理 商店 的 经 
营 : 销售 、 订 购 、 顾 客 跟 踪 和 动物 的 基本 信息 。 然 而 ， 她 强调 这 个 系统 必须 足够 灵活 ， 能 够 
添加 新 的 功能 和 应 用 。 

Sally 的 宠物 商店 的 详细 信息 将 会 在 其 他 章节 中 进行 分 析 。 目 前 ， 你 最 好 光顾 本 地 的 宠物 商 
店 或 者 与 朋友 交流 ， 对 他 们 遇 到 的 问题 有 一 个 初步 的 了 解 ， 并 弄 清楚 数据 库 将 如 何 帮助 他 们 。 


1.10 Rolling Thunder 自 行车 


Rolling Thunder 自 行车 公司 定制 自行 车 。 它 的 数据 库 应 用 相 比 宠物 商店 应 用 更 完整 ， 并 且 
它 提 供 了 例子 来 说 明 如 何 将 数据 库 系 统 的 各 部 分 组 合 到 一 起 。 这 个 应 用 还 包含 很 多 详细 的 表 
单 ， 说 明 如 何 创 建 用 户 界面 。 此 外 ， 大 部 分 表单 包含 处 理 一 般 业 务 操作 的 代码 。 学 习 此 代码 
可 以 帮助 你 建立 自己 的 应 用 。Rolling Thunder 应 用 具有 一 个 综合 帮助 系统 ， 描 述 公司 和 每 个 表 
单 。 这 个 数据 库 包 含 数 百 个 顾客 和 自行 车 的 实际 数据 。 
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Rolling Thunder 自 行车 公司 的 一 项 重要 任务 是 接收 新 自行 车 的 订单 。 已 有 的 一 些 功能 帮助 
非 专 业 人 员 挑 选 一 辆 好 的 自行 车 。 制 造 自行 车 时 ， 员 工 将 设计 记录 在 Assembly 表 单 上 。 自 行 
车 送 到 后 ， 顾 客 付款 。 顾 客 的 付款 记录 在 金融 表单 中 。 当 自行 车 装 好 零 部 件 后 ， 库 存 数量 自 
动 递 碱 。 零 部 件 从 供应 商 那里 订购 ， 货 到 付款 。 

Rolling Thunder 自 行车 公司 执行 的 操作 与 其 他 任何 业务 都 很 相似 。 通 过 学 习 这 个 应 用 和 技 
术 ， 你 将 能 为 任何 企业 创建 稳固 的 应 用 。 


1.11 可 行 性 研究 


信息 系统 的 想法 可 以 有 很 多 种 来 源 : 用 户 、 上 级 管理 者 、 信 息 系 统 分 析 学 家 、 竞 争 者 或 其 
他 行业 的 公司 。 获 得 最 初 若干 人 支持 的 想法 可 能 会 提议 为 新 项 目 。 如 果 项 目 规模 很 小 很 容易 
创建 ， 只 需要 几 天 时 间 。 而 较 大 规模 的 项 目 则 需要 更 仔细 地 研究 。 如 果 项 目 将 关系 到 企业 内 
部 的 重要 部 门 ， 需 要 昂贵 的 硬件 ， 或 者 需要 充裕 的 开发 时 间 ， 那 么 就 要 采用 一 种 更 为 正式 的 
可 行 性 研究 。 

系统 分 析 课 程 会 对 可 行 性 研究 进行 详细 介绍 。 然 而 ， 由 于 它们 具有 的 特性 ， 对 使 用 数据 库 
方法 引发 的 典型 成 本 和 效益 进行 研究 是 有 用 的 。 

可 行 性 研究 的 目标 在 于 决定 计划 中 的 项 目 是 否 值得 进行 。 研 究 基本 分 为 两 类 : 成 本 和 潜在 
效益 。 如 图 1-20 所 示 ， 成 本 一 般 划 分 为 两 类 : 预先 或 一 次 性 成 本 和 当 项 目 使 用 时 的 运行 成 本 。 
效益 一 般 分 为 三 类 : 降低 运行 成 本 、 提 高 价值 或 超越 竞争 对 手 的 战略 优势 。 


高 价值 
更 好 的 数据 访问 
更 优 的 决策 
更 好 的 通信 
更 及 时 的 报表 
支持 对 变化 更 快 的 反应 
软件 和 硬件 维护 新 产品 和 服务 
战略 上 的 优势 
胜 过 竞争 对 手 





图 1-20 引入 数据 库 管 理 系 统 的 一 般 成 本 和 效益 。 注 意 ， 效 益 可 能 很 难 测量 ， 
尤其 对 于 战术 和 战略 的 决策 。 但 列 出 潜在 的 效益 仍然 是 重要 的 。 即 使 
不 能 准确 赋值 ， 管 理 者 仍 需要 查看 完整 的 列表 


1.11.1 成 本 


几乎 所 有 项 目 都 会 承担 相似 的 预先 成 本 。 企 业 通 常 必须 购买 额外 的 硬件 、 软 件 以 及 通信 设 
备 〈 例 如 ， 组 建 局 域 网 )。 开 发 系统 的 成 本 在 图 中 列 出 ， 包 括 所 有 附加 研究 的 成 本 。 其 他 一 次 
性 成 本 包括 将 数据 转化 至 新 系统 和 初期 对 用 户 进行 的 培训 的 费用 。 数 据 库 管 理 系统 是 昂贵 的 
软件 。 例 如 ， 对 于 大 型 项 目 ， 诸 如 Oracle 这 样 的 软件 成 本 很 容易 达到 几 百 万 美元 。 每 年 还 必须 
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购买 软件 的 维护 和 升级 服务 。 

厂商 可 以 帮助 你 估算 硬件 和 软件 的 成 本 。 只 要 你 知道 最 终 系统 的 大 概 规模 (例如 , 用 户 数 )， 
厂商 可 以 提供 比较 精确 的 成 本 估算 。 数 据 转换 的 成 本 可 由 数据 量 大 小 来 估算 。 最 大 的 难题 通 
常 在 于 估算 开发 新 系统 的 成 本 。 如 果 企 业 具 有 类 似 项 目的 经 验 ， 那 么 依据 项 目 规模 使 用 历史 
数据 可 以 估算 时 间 和 成 本 。 否 则 ， 可 以 通过 要 投入 的 人 员 和 时 间 来 估算 成 本 。 

一 旦 项 目 完工 并 且 系 统 安装 完毕 ， 还 有 一 些 地 方 将 会 产生 成 本 。 例 如 ， 新 系统 可 能 需要 额 
外 的 人 力 和 经 费 。 软 件 和 硬件 必须 修改 和 替换 一 一 承担 维护 成 本 。 处 理 员工 周转 和 系统 修改 可 
能 需要 额外 的 训练 和 支持 。 同 样 ， 只 要 你 了 解 项 目的 规模 ， 这 部 分 成 本 很 容易 估计 。 

不 幸 的 是 ， 信 息 系统 (IS) 设计 者 对 于 成 本 的 估算 并 不 很 成 功 。 例 如 ，1995 年 1 月 《PC 
Week》 报 导 说 31% 的 新 信息 系统 项 目 在 完成 前 就 取消 了 。 此 外 ，53% 的 结 题 项 目 超过 了 预算 
的 189%。 最 大 的 困难 在 于 估算 设计 和 开发 新 软件 所 需 的 时 间 。 每 个 开发 者 在 软件 开发 能 力 方 
面 都 是 不 同 的 。 在 大 型 项 目 中 ， 人 员 始 终 在 变 ， 因 此 ， 精 确 预 测 设计 和 开发 新 系统 所 需 的 时 
间 一 般 是 不 可 能 的 。 尽 管 这 样 ， 管 理 者 仍然 需要 对 成 本 进行 估算 。 


1.11.2 效益 


很 多 情况 下 效益 更 难 估算 。 有 些 效益 是 有 形 的 ， 可 以 用 精确 的 百分比 度量 。 例 如 ， 事 务 处 
理 系 统 比 决策 支持 系统 (DSS) 容易 评估 , 因为 前 者 的 效益 一 般 来 自 它们 降低 运行 成 本 的 能 力 。 
一 个 系统 可 能 会 提高 员工 处 理 产品 的 数量 ， 这 样 便 允 许 公司 进行 扩展 而 不 增加 人 力 成 本 。 数 
据 库 方法 可 以 使 员工 更 容易 创建 和 修改 报表 ， 从 而 减少 信息 系统 的 人 力 成 本 。 最 后 ， 新 的 信 
息 系统 会 减少 数据 中 的 错误 ， 获 得 更 优 的 决策 。 

很 多 效益 是 无 形 的 ， 无 法 赋予 确定 的 金钱 价值 。 例 如 ， 管 理 者 能 更 好 地 访问 数据 可 以 带 来 
效益 。 改 进 通信 ， 做 出 更 优 的 决策 ， 并 且 管 理 者 在 变化 的 环境 中 能 做 出 更 快 的 反应 。 类 似 地 ， 
新 系统 可 能 会 使 公司 生产 出 新 产品 和 提供 新 服务 ， 或 向 已 有 客户 销售 附加 产品 。 类 似 地 ， 公 
司 实现 的 系统 可 能 会 带 来 竞争 优势 。 例 如 ， 自 动 订货 系统 通常 会 促使 顾客 进行 更 多 的 订购 。 
这 样 公司 对 于 其 竞争 者 而 言 就 具有 了 优势 。 

当 建 立信 息 系统 用 于 使 操作 级 任务 自动 化 ， 并 获得 切实 的 效益 时 ， 评 估 系 统 的 经 济 效益 是 
相对 简单 的 。 改 进 数据 访问 的 影响 在 降低 成 本 和 增长 收入 方面 是 容易 观察 和 估量 的 。 然 而 ， 
当 建 立信 息 系统 改进 战术 和 战略 决策 时 ， 确 定 和 估算 效益 就 十 分 困难 。 例 如 ， 对 于 市 场 经 理 
来 说 ,在 周一 而 不 是 周三 就 能 获得 上 周 销售 数据 的 价值 是 多 少 呢 ? 

在 数据 库 项 目 中 ， 效 益 可 以 来 自 改进 操作 一 一 这 将 节省 成 本 。 还 有 其 他 额外 的 效益 ， 因 为 
现在 为 用 户 创建 报表 更 加 便捷 ， 修 改 系统 所 需 的 时 间 也 更 少 。 用 户 还 可 以 获得 更 好 的 数据 访 
间 ， 因 为 这 可 以 通过 用 户 创建 自己 的 查询 来 完成 一 不必 等 待 程序 员 编写 新 程序 。 

数据 库 项 目 可 以 带 来 很 多 效益 ， 但 企业 获得 这 些 效益 的 前 提 是 项 目 正 确 、 按 时 完成 ， 并 且 
不 超出 预算 。 要 完成 这 个 任务 ， 必 须 和 仔细 设计 系统 。 此 外 ， 你 的 团队 必须 与 用 户 沟通 ， 合 理 
分 配 工 作 ， 跟 踪 开 发 进度 。 需 要 遵守 设计 方法 学 。 


小 结 





商业 应 用 最 重要 的 特色 之 一 是 允许 多 用 户 同时 共享 数据 。 没 有 DBMS， 共 享 数据 会 引发 很 
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多 问题 。 例 如 ， 如 果 数 据 定义 分 别 存储 在 每 个 程序 中 ， 改 变数 据 文件 会 变 得 非常 困难 。 一 
程序 及 其 数据 文件 的 改变 会 造成 其 他 程序 崩溃 。 每 个 应 用 将 需要 特别 的 代码 来 提供 数据 安全 
性 、 并 发 性 和 完整 性 。 通 过 将 精力 集中 于 数据 ， 数 据 库 方法 将 数据 与 程序 分 离 。 这 种 独立 性 
使 得 扩展 数据 库 而 不 使 程序 崩溃 成 为 可 能 。 

DBMS 拥 有 很 多 组 件 。DBMS 必 备 的 功能 包括 通过 数据 库 引擎 存 取 数据 ， 通 过 数据 字典 帮 
助 DBMS 及 其 用 户 定位 数据 。 其 他 一 般 功 能 包括 查询 语言 ， 用 于 从 DBMS 获 取 数 据 来 回答 业务 
问题 。 应 用 开发 工具 包括 报表 编写 器 、 表 单 生成 器 和 用 于 创建 菜单 及 帮助 文件 的 应 用 生成 器 。 
高 级 数据 库 系 统 提供 用 于 控制 数据 访问 安全 性 ， 与 其 他 软件 包 协 作 及 与 其 他 数据 库 系统 通信 
的 工具 。 

数据 库 系 统 的 发 展 经 历 了 几 个 阶段 。 早 期 的 层次 数据 库 适 用 于 特殊 目的 ， 但 能 提供 有 限制 
的 数据 访问 。 网 状 数据 库 允 许 用 户 建立 复杂 查询 ， 但 必须 预先 为 链接 建立 索引 。 关 系数 据 库 
是 目前 建立 商业 应 用 的 主导 方法 。 数 据 一 旦 精心 定义 ， 就 能 高 效 存 取 来 回答 业务 问题 。 面 向 
对 象 方法 是 创建 软件 的 新 方法 。 面 向 对 象 系统 允许 你 创建 你 自己 的 新 抽象 数据 类 型 。 它 们 还 
支持 子 表 ， 很 容易 扩充 一 个 对 象 的 类 而 不 必 从 零 开 始 重 新 定义 。 

无 论 使 用 哪 种 类 型 的 数据 库 ， 应 用 开发 遵循 相似 的 步骤 。 第 一 ， 确 认 用 户 需 求 ， 根 据 需要 
收集 数据 ， 定 义 数据 库 的 结构 。 然 后 ， 开 发 将 要 使 用 的 表单 和 报表 ， 建 立 所 需要 的 查询 。 最 
后 ， 将 不 同 元 素 合 并 到 一 起 ， 组 成 符合 用 户 需求 的 完善 应 用 。 如 果 需 要 ， 将 数据 库 在 企业 内 
部 或 通过 互联 网 、 内 联网 分 散 部 署 。 将 数据 库 与 强大 的 分 析 和 表现 工具 相 结合 ， 可 以 提供 额 
Wiis hss: a ert eh ote le via 
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和， 了 月琴。 在 一 个 


要 用 到 的 工具 的 信息 。 区 到 最 新 的 参考 手册 。 安 装 最 新 的 
9 空间 。 对 于 一 类 项 目 ， 应 当 登录 、 na 





关键 词 
抽象 数据 类 型 应 用 生成 器 数据 字典 
数据 独立 性 数据 库 数据 库 引擎 
数据 库 管理 系统 (DBMS ) 可 行 性 研究 表单 生成 器 
层次 数据 库 内 联网 网 状 数据 库 
面向 对 象 (00) 的 数据 库 联机 分 析 处 理 (OLAP) 持久 对 象 
持久 存储 模块 关系 数据 库 报表 编写 器 
子 表 

复习 题 


1. DBMS 方 法 对 于 应 用 开发 有 什么 好 处 ? 





2. DBMS 的 基本 组 成 有 哪些 部 分 ? 

3. 为 什么 关系 数据 库 方法 优 于 早先 的 方法 ? 

4. 面向 对 象 方法 与 关系 方法 有 什么 不 同 ? 

5. 为 什么 说 抽象 数据 类 型 和 子 表 是 关系 方法 和 对 象 方 法 的 混合 物 ? 
6. 使 用 数据 库 系 统 进行 应 用 开发 的 主要 步 难 是 什么 ? 

7. 可 行 性 研究 的 目的 是 什么 ? 


Ant Adam 354 Elm $5/5/1964 
Bono Sonny 765 Pine 8/8/1972 
Cass Mama 886 Oak 2/2/1985 
Donovan Michael 421 Willow 3/3/1971 
Moon Keith 554 Cherry 4/4/1972 
Morrison Jim 676 Sandalwood 5/5/1968 


Jones Joe ”113.42 
Smith Mary 993.55 
Brown Laura 225.44 
Dieter Jackie 664.90 
Wodkoski john 984.00 


Sanchez Pavula 194.87 
Chen Charles 487.34 
Hagen Fritz 595.55 
Hauer Marianne 627.39 
Nguyen Suzie 433.88 
Martin Mark 983.31 


Ant, Adam 5/S/1964 
Brown, Laura 225.24 
Chen, Charles 487.34 
712.58 

Bono, Sonny 8/8/1972 
Dieter, jackie 664.90 
Jones, joe 114.32 
779.22 





1. 使 用 图 中 的 两 个 表 创 建 一 个 新 的 数据 库 。 随 意 添加 更 多 数据 。 确 保 将 具有 下 划 线 的 列 设 为 
主 码 。 接 着 ， 创 建 包含 两 个 表 中 每 一 列 的 查询 。 依 据 此 查询 创建 一 个 与 图 中 相似 的 报表 。 
提示 : 使 用 向 导 创建 报表 。 

2. 阅读 你 使 用 的 DBMS 的 文档 ， 写 一 个 简要 的 提纲 解释 如 何 : 

a. 创建 一 个 表 。 
b. 创建 一 个 简单 查询 。 
c. 创建 一 个 报表 。 
3. 采访 一 个 朋友 或 亲 威 ， 询 问 他 或 她 的 工作 ， 拟 定 两 张 用 于 其 工作 的 数据 库 应 用 的 表单 。 





钉 ] 音 商 介 23 


4. 找 最 近 的 一 篇 比较 两 个 以 上 DBMS 软 件 包 的 参考 文献 。 列 出 各 自 的 主要 特长 。 描 述 各 自 的 
基本 功能 (查询 、 报 表 编写 器 等 )。 

5. 描述 大 学 俱乐部 或 学 生 组 织 如 何 使 用 数据 库 改 进 其 服务 水 平 。 

6. 利用 互联 网 资源 ， 选 择 一 个 DBMS 厂 商 ， 确 定 所 需 组 件 ， 估 算 一 个 中 等 规模 项 目 购买 完整 

系统 所 需 的 花费 。 该 数据 库 将 包含 至 少 100 个 主要 表 和 大 约 800 兆 字 节 的 数据 存储 。 系 统 将 

至 少 被 20 个 用 户 同时 使 用 一 一 他 们 大 部 分 使 用 与 中 心服 务 器 相连 的 个 人 计算 机 。 

.一 个 公司 正在 考虑 建立 一 个 新 系统 用 于 跟踪 评价 和 雇员。 在 与 用 户 面谈 后 ， 你 了 解 到 系统 潜 

在 的 效益 包括 减少 确定 升迁 所 需 的 了 时间， 减少 一 个 全 职 岗位 ， 避 免 每 年 四 次 且 每 次 打 

印 3 000 页 报表 ， 更 明智 的 决策 ， 这 将 减少 每 年 250 000 美 元 的 EEO 诉 讼 。 系 统 成 本 包括 最 初 

的 开发 成 本 (35 000 美 元 ) ， 新 硬件 (12 000 美 元 ) ， 新 软件 (10 000 美 元 ) ， 和 每 年 的 

维护 费用 大 约 4 000 美 元 。 还 会 有 大 约 每 年 6 000 美 元 的 培训 成 本 。 为 这 个 项 目 准 备 一 个 可 

行 性 研究 。 在 不 同 利率 (2%，5%，8% 和 10%) 和 不 同 的 项 目 期 望 寿命 (1 年 ，3 年 ，5 年 

和 10 年 ) 的 前 提 下 进行 分 析 。 还 有 没有 其 他 应 当 考 虑 的 效益 和 成 本 ? 

:一 个 公司 要 你 创建 一 个 小 型 应 用 ， 用 来 帮助 管理 跟踪 销售 订单 。 订 单 来 自 电话 或 网 站 上 的 
电子 邮件 ， 秘 书 将 把 数据 输入 到 你 的 应 用 中 。 现 在 ， 公 司 通过 电话 接收 很 多 订单 ， 这 需要 

两 个 秘书 同时 上 班 以 避免 电话 占线 。 如 果 50% 的 订单 可 以 转移 到 联机 系统 (已 经 开发 完成 ) 

上 去 ， 那 么 公司 可 以 减少 一 个 话 务 秘书 (最 低 工资 标准 )。 该 公司 已 经 拥有 一 台 计 算 机 ， 

但 是 需要 购买 DBMS。 公 司 愿 意 为 这 个 应 用 支付 多 少 费用 ? 假设 公司 的 产品 很 简单 并 且 数 

据 转 移 很 方便 ， 你 开发 这 个 系统 要 花费 多 长 时 间 ? 

Sally 的 宠物 商店 

9. 安装 宠物 商店 数据 库 ， 如 果 已 经 安装 ， 则 在 局 域 网 内 找到 它 。 打 印 (或 书写 ) 数据 库 中 所 
使 用 表 的 列表 。 使 用 帮助 命令 找 出 你 使 用 的 Microsoft Access 的 版 本 号 。 

10. 光顾 附近 的 一 个 宠物 商店 ， 做 一 个 列表 包含 待 售 的 10 种 商品 和 5 种 动物 。 将 这 些 数据 输入 
到 宠物 商店 数据 库 的 适当 表 中 。 

11. 创建 一 个 邮寄 地 址 报表 ， 列 出 所 有 居住 在 加 利 福 尼 亚 (CA) 的 顾客 。 首 先 建立 一 个 包含 
Customer 表 和 City 表 的 查询 。 然 后 在 查询 的 基础 上 使 用 报表 向 导 创 建 一 个 报表 。 

12. 概述 宠物 商店 运营 的 基本 任务 。 确 认 将 会 用 到 的 一 些 基 本 数据 项 。 

Rolling Thunder 自 行车 

13. 安装 Rolling Thunder 自 行车 数据 库 ， 如 果 已 经 安装 ， 则 在 局 域 网 内 找到 它 。 使 用 
BicycleOrder， 创 建 用 于 登录 新 自行 车 的 表单 。 

14. 利用 Rolling Thunder 帮 助 系 统 简 要 描述 公司 及 其 主要 流程 。 确 认 公 司 内 的 主要 业务 实体 。 

15. 当 自 行车 制造 完成 后 ， 如 何 将 数据 输入 到 数据 库 ? 在 此 阶段 你 预计 会 产生 什么 问题 ? 

16. 查阅 关系 /类 图 ， 解 释 自 行车 部 件 是 什么 ， 以 及 它 是 怎么 连接 到 自行 车 上 的 。 从 数据 中 举例 
说 明 。 


参考 网 站 
网 站 描述 


http:/www.microsoft.com/office/access Microsoft Access 


~ 


oo 
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http:// www.microsoft.com/sql Microsoft SQL Server 
http://www.oracle.com Oracle 

http://otn.oracle.com Oracle 技 术 网 站 ， 包 括 软件 下 载 
http:Wwww.cai.com/products/ingres.htm Ingres 

http://www.sybase.com Sybase 
http:/www,software.ibm.com/data/db2 IBM DB2 
http://www.mysql.com 免费 但 有 限制 的 DBMS 
http://www.postgresql.org 一 个 更 好 的 免费 DBMS 
http://www.acm.org 计算 机 协会 


http://groups.google.com/groups?group=comp.databases ”数据 库 问 题 的 新 闻 组 
http://dbforums.com 

http://dbaclick.com 

http://www.devx.com/dbzone/Door/7022 
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McGraw-Hill, 2001. {One of few reference books on DB2 and written by IBM 
employees.] 





第 一 部 分 





系统 议 计 


要 创建 有 效 的 应 用 ， 必 须 首 先 了 解 业 务 并 决定 如 何 帮助 用 户 。 在 ， 
数据 库 的 背景 下 ， 最 重要 的 问题 是 确定 必须 要 存储 的 数据 。 这 个 过 程 
需要 两 个 基本 步骤 。 在 第 2 章 你 要 设计 一 个 用 于 分 析 业 务实 体 及 其 关 
系 的 逻辑 (或 概念 ) 数据 模型 。 这 个 逻辑 数据 模型 显示 在 类 图 里 ， 并 
且 指 明 公司 的 各 种 业务 规则 。 

设计 的 第 二 步 是 创建 一 个 执行 模型 ， 表 示 数 据 如 何在 数据 亩 管理 
系统 中 存储 。 这 一 步 一 般 包 括 创 建 一 系列 设计 合理 的 表 ， 这 些 表 组 成 
关系 数据 库 。 第 3 章 描述 如 何 创 建 这 些 表 ， 并 解释 为 什么 精心 定义 它 
很 重要 。 











数据 库 设计 


本 章 学 习 内 容 


“在 设计 系统 时 ， 为 什么 模型 是 重要 的 ? 
“什么 是 对 象 ? 

"什么 是 类 图 (或 实体 关系 图 ) ? 

“ 什么 是 不 同 的 数据 类 型 ? 

“ 什么 是 事件 ? 在 数据 库 设计 中 如 何 描述 ? 


2.1 开发 漫谈 


Miranda: 唔 ，Ariel， 你 说 得 对 。 数 据 库 似乎 是 完成 这 份 工作 的 正确 手段 。 

Ariel. 那 你 决定 接手 你 叔叔 公司 的 这 份 工 作 啦 ? 

Miranda: ”是 的 ， 这 份 工作 报酬 不 错 ， 而 且 公 司 似乎 愿意 让 我 边 学 边 干 。 但 是 ， 在 我 完 
成 这 个 项 目前 公司 只 能 付 给 我 一 小 笔 钱 。 

Ariel. 不 错 。 那 你 什么 时 候 开始 呢 ? 

Miranda:， 这 正 是 另 一 个 问题 。 我 不 是 很 确定 应 该 从 哪里 开始 。 

Ariel， 这 可 是 个 问题 。 你 知道 这 个 应 用 程序 要 做 些 什 么 吗 ? 

Miranda， 唔 ， 我 与 经 理 和 一 些 员 工交 流 过 ， 但 是 还 有 很 多 地 方 我 不 清楚 。 这 个 项 目 比 
我 想象 得 要 大 。 我 感觉 要 了 解 所 有 的 细节 很 困难 。 我 不 知道 的 报表 和 术语 太 
多 了 。 而 且 其 中 一 个 销售 人 员 开 始 谈论 起 数据 的 所 有 规则 一 一 例如 对 于 田 体 客 
户 来 说 ， 顾客 编 号 是 五 位 数字 ， 而 对 于 政府 账户 来 说 是 四 位 数字 加 两 个 字母 。 

Ariel. 或 许 你 需要 一 个 系统 来 记录 他 们 告诉 你 的 所 有 东西 。 


2.2 简介 


任何 信息 系统 的 目标 都 是 为 用 户 增加 价值 。 要 达到 这 个 目标 需要 回答 两 个 重要 的 问题 : 用 
户 是 谁 ? 信息 系统 怎样 才能 帮助 他 们 ? 这 两 个 问题 回答 起 来 可 能 都 十 分 困难 ， 需 要 不 断 调 研 。 

在 对 一 个 项 目 花费 大 量 金钱 之 前 ， 大 多 数 企 业 会 进行 可 行 性 研究 ， 为 这 两 个 问题 提供 最 初 
的 解答 。 企 业 对 以 下 三 个 关键 领域 的 利益 评估 特别 感 兴趣 : (1) 降低 成 本 ，(2) 提高 销售 额 
或 收入 ，(3) 竞争 优势 或 长 期 利益 。 

按时 并 在 预算 之 内 完成 项 目 是 一 个 难题 。 只 有 几 个 用 户 和 一 两 个 开发 者 的 小 型 项 目 一 般 是 
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很 简单 的 。 然 而 ， 你 仍然 必须 精心 设计 数据 库 ， 使 它们 足够 灵活 以 便 处 理 将 来 的 需求 。 同 样 ， 
你 需要 做 记录 ， 以 便 将 来 的 开发 者 能 够 很 容易 地 理解 这 个 系统 ， 它 的 目标 和 你 所 做 的 决定 。 
大 型 项 目 带 来 额外 的 复杂 性 。 由 于 有 众多 用 户 和 若干 开发 者 ， 你 需要 将 项 目 划 分 为 较 小 的 问 
题 ， 在 用 户 和 设计 者 之 间 交 流 意见 ， 并 且 跟 踪 团 队 的 进度 。 

正如 系统 分 析 和 设计 课程 里 所 述 ， 为 设计 系统 和 管理 项 目 创 造 了 很 多 正规 的 方法 。 详 细 信 
息 可 以 查阅 任何 一 本 有 关系 统 开发 的 教材 。 最 近 ， 为 加 快 开发 进度 进行 了 很 多 尝试 ， 著 名 的 
有 快速 应 用 开发 (RAD) 方法 。Steve McConnell 的 著作 《Rapid Development: Taming Wild 
Software Schedules》 对 设计 的 重要 性 、 如 何 减 少 开 发 时 间 以 及 何 时 不 能 减少 开发 时 间 的 精彩 
分 析 。 这 些 方法 皆 可 用 于 数据 库 应 用 的 开发 上 。 

所 有 这 些 方法 中 重要 的 一 步 是 构建 系统 模型 。 模 型 是 现实 世界 中 系统 的 简单 抽象 。 在 很 多 
情况 下 ， 模 型 由 一 张 提 供 系 统 直 观 图 形 的 图 片 组 成 。 就 像 建筑 工人 需要 蓝图 建造 建筑 物 一 样 ， 
信息 系统 开发 者 需要 设计 来 帮助 他 们 创建 有 用 的 系统 。 如 图 2-1 所 示 ， 概念 模型 建立 在 系统 的 
用 户 视图 基础 上 。 执 行 模型 建立 在 概念 模型 基础 上 ， 描述 数据 如 何 存储 。DBMS 使 用 执行 模型 
来 存储 数据 。 


Customer(CustomeriD, Name, Address,...) 
) 


数据 的 用 户 视图 执行 (关系 ) 数据 模型 


显示 业务 实体 、 关 一 系列 设计 合理 的 利用 索引 和 
系 和 规则 的 类 图 表 。 使 用 数据 规范 存储 方法 提 
化 来 获得 列表 高 性 能 





图 2-1 设计 模型 。 概 念 模型 记录 和 描述 系统 的 用 户 视图 。 执 行 模型 描述 数据 存储 
的 方法 。 最 终 的 物理 数据 库 可 能 使 用 像 索引 这 样 的 存储 技术 来 提高 性 能 


设计 系统 一 般 使 用 三 种 通用 模型 : 过 程 模型 、 类 或 对 象 模型 和 事件 模型 。 过 程 模型 由 协作 
图 或 数据 流 图 (DFD) 表示 。 它 们 一 般 在 系统 分 析 课程 中 详细 介绍 ， 用 于 重新 设计 企业 内 的 
信息 流 。 类 图 或 以 前 的 实体 关系 图 用 于 显示 系统 中 的 主要 实体 或 对 象 。 事 件 模型 如 序列 图 或 
状态 图 是 比较 新 颖 的 ， 用 于 描述 各 种 事件 的 时 间 选 择 和 消息 在 各 个 对 象 间 如 何 传递 。 每 种 模 
型 都 用 于 从 不 同 角度 显示 当前 设计 的 系统 。 优 秀 的 设计 者 应 当 能 够 创建 并 使 用 所 有 三 种 模型 。 
不 过 ， 类 图 是 设计 和 建立 数据 库 应 用 所 使 用 的 最 重要 的 工具 。 

数据 库 应 用 可 以 是 较 大 型 项 目的 一 部 分 ， 这 种 项 目 需 要 正规 的 项 目 管理 技术 来 控制 成 本 和 
监视 进度 。 数 据 库 项 目 也 可 以 是 较 小 型 的 、 独 立 的 项 目 ， 由 一 个 接近 用 户 的 小 团队 开发 ， 快 
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速 建立 新 系统 。 在 这 两 种 情况 下 ， 项 目 管理 控制 和 系统 设计 方法 将 会 不 同 。 然 而 ， 某 些 基 本 
的 数据 库 设计 技术 是 一 样 的 。 本 书 集中 于 数据 库 设计 ， 而 把 系统 和 项 目 管理 问题 留 给 系统 开 
发 课程 。 

2.3 开始 设计 之 前 


如 今 的 DBMS 工 具 是 华丽 和 吸引 人 的 。 在 使 用 它 建立 用 户 希 望 看 到 的 表单 和 报表 时 ， 通 常 
是 很 诱 人 的 。 然 而 ， 在 你 能 建立 表单 和 报表 之 前 ， 必 须 正确 设计 数据 库 。 如 果 在 数据 库 设计 
中 出 错 ， 那 么 创建 表单 和 报表 将 会 很 困难 ， 而 且 ， 以 后 进行 修改 将 会 花费 相当 多 的 时 间 。 

在 试图 建立 任何 东西 之 前 ， 要 通过 与 用 户 交 谈 来 准确 决定 需要 什么 数据 。 有 时 ， 用 户 明确 
知道 他 们 想 要 什么 。 但 是 大 部 分 情况 下 ， 用 户 对 于 他 们 想 要 什么 只 有 粗略 的 想法 ， 对 于 计算 
机 能 做 什么 只 有 模糊 的 认识 。 在 项 目 开 发 中 ， 与 用 户 交流 是 关键 的 一 步 。 最 重要 的 方面 在 于 
确认 〈1) 要 收集 的 确切 数据 ，(2) 各 种 数据 如 何 关联 和 ，(3) 数据 需要 在 数据 库 中 存储 多 长 
时 间 。 图 2-2 描 述 了 设计 流程 的 初始 步骤 。 





1. 明确 系统 的 目标 
2. 与 用 户 交谈 来 确定 基本 的 表单 和 报表 
3. 确认 要 存储 的 数据 项 


4. 设计 类 ( 表 ) 和 关系 
5. 确认 所 有 业务 约束 
6. 检验 设计 与 业务 规则 是 否 相符 





图 2-2 数据 库 设计 中 的 初始 步 又。 数据 库 设 计 代 表 了 企业 的 业务 规则 。 你 必须 
与 用 户 仔 细 面 谈 来 确保 正确 理解 业务 规则 。 这 个 流程 通常 是 迭代 的 ， 当 
你 设计 类 时 你 需要 向 用 户 获 取 更 详细 的 信息 
一 旦 你 确定 了 数据 元 素 ， 就 需要 恰当 地 组 织 它们 。 正 如 本 章 及 下 一 章 将 要 描述 的 ， 将 数据 
放 入 表 中 的 规则 是 很 简单 的 。 然 而 ， 开 发 者 经 常 面 对 的 一 个 问题 是 ， 数 据 库 结构 总 是 依赖 于 
业务 规则 。 真 正 的 难题 在 干 确定 业务 规则 。 例 如 ， 考 虑 客户 的 标准 订单 :订单 只 能 来 自 一 位 
客户 ， 还 是 允许 两 个 或 多 位 客户 一 起 提交 订单 ? 这 个 (以 及 类 似 的 ) 问题 的 解答 在 很 大 程度 
上 影响 数据 库 的 设计 。 因 此 ， 数 据 库 设计 的 全 部 要 点 在 于 确认 并 形式 化 业务 规则 。 
要 建立 商业 应 用 ， 就 必须 了 解 业 务 细 节 。 这 个 任务 很 困难 ， 但 并 非 不 可 能 ， 而 且 几 乎 总 是 
很 有 趣 。 尽 管 每 种 业务 不 同 ， 但 在 商业 界 有 很 多 普遍 问题 。 这 些 问题 中 的 一 部 分 将 贯穿 本 书 。 
在 本 书 中 使 用 的 开发 方法 可 以 应 用 并 扩展 到 很 多 普遍 的 业务 问题 上 。 


2.4 设计 数据 库 


信息 系统 是 复杂 的 、 不 断 变化 的 ， 并 且 创 建 和 维护 都 很 昂贵 。 但 是 设计 合理 的 系统 能 给 企 
业 带 来 巨大 的 利益 。 建 立 有 用 的 系统 需要 理解 用 户 并 与 之 交流 。 这 需要 组 织 和 控制 一 个 开发 
团队 。 系 统 设计 是 用 于 促进 这 种 交流 和 团队 工作 的 模型 。 设 计 是 基本 业务 操作 的 简化 或 描绘 。 
设计 模型 还 记录 业务 中 的 所 有 基本 功能 、 假 定 和 约束 。 


2.4.1 确定 用 户 需求 
设计 系统 的 挑战 之 一 在 于 确定 需求 。 在 创建 一 个 实用 系统 前 ， 必 须 彻底 了 解 业务 需要 。 一 
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个 关键 步骤 是 访问 用 户 和 观察 公司 的 运转 。 尽 管 这 一 步 听 起 来 容易 ， 但 它 可 能 是 十 分 困难 
的 一 一 尤其 当 各 个 用 户 的 意见 不 一 致 时 。 甚 至 在 最 好 的 情况 下 ， 交 流 也 会 十 分 困难 。 和 良好 的 交 
流 技巧 和 经 验 对 成 为 一 个 好 的 设计 者 是 非常 重要 的 。 

设计 数据 库 应 用 最 重要 的 任务 之 一 就 是 要 确定 存储 什么 数据 。 只 要 你 仔细 收集 并 组 织 数 
据 ，DBMS 会 使 创建 和 修改 报表 变 得 很 容易 。 当 与 用 户 交谈 时 ， 你 会 收集 用 户 文档 ， 例 如 报表 
和 表单 。 这 些 文档 提供 了 有 关公 司 的 基本 数据 和 操作 信息 。 在 初始 设计 阶段 ,你 需要 获取 三 条 
基本 信息 : (1) 需要 收集 的 数据 ，(2) 数据 类 型 ( 域 )，(3) 数据 的 数量 。 


2.4.2 业务 对 象 


数据 库 设计 关注 需要 存储 的 数据 。 随 后 ， 可 以 根据 用 户 需 要 创建 查询 搜索 数据 ， 创 建 输入 
表单 添加 新 数据 ， 创 建 报表 获取 和 显示 数据 。 目 前 ， 最 重要 的 步骤 在 于 正确 组 织 数据 ， 以 便 
数据 库 系统 能 够 有 效 处 理 它 。 

所 有 的 业务 都 涉及 实体 或 对 象 ， 例 如 客户 、 产 品 、 雇 员 和 销售 。 从 系统 的 角度 来 看 ， 实 体 
是 现实 世界 中 你 希望 跟踪 的 信息 。 实 体 由 其 
属性 或 特性 描述 。 例 如 ， 客 户 实体 具有 姓名 、 
地 址 和 电话 号 码 。 在 建 模 术语 中 ， 列 出 其 属 
性 的 实体 称 为 类 。 在 编程 环境 中 ， 类 还 可 以 
包含 它 能 执行 的 方法 或 函数 ， 它 们 可 以 与 类 
列 在 一 起 。 例 如 ， 客 户 类 可 能 会 有 一 个 方法 
用 于 添加 一 个 新 客户 。 数 据 库 设 计 很 少 需要 
描述 方法 ， 所 以 它们 一 般 不 被 列 出 。 

数据 库 设计 者 需要 某 种 方法 记录 和 向 用 
户 和 其 他 设计 者 显示 类 的 列表 。 已 经 开发 出 ”图 2-3 类 。 类 具有 名 称 、 属 性 和 方法 。 属 性 用 于 描 
了 许多 图 形 技术 ， 但 较 新 颖 的 手段 是 使 用 类 述 类 和 要 收集 的 数据 。 方 法 是 类 能 执行 的 操 
图 。 类 图 将 每 个 类 显示 为 一 个 框 ， 其 中 包含 作 ， 它 们 在 数据 库 设计 中 很 少 使 用 
该 类 的 属性 。 通 过 用 线段 连接 类 与 类 ， 类 图 还 能 显示 这 些 类 是 如 何 相互 连接 的 。 图 2-3 说 明了 
如 何 描述 一 个 单独 的 类 。 


2.4.3 家 和 关系 


数据 库 设计 的 主要 目的 是 确定 用 户 需要 什么 样 的 数据 。 这 些 数 据 需 要 谨慎 存储 ， 以 便 数据 
库 能 高 效 存 取 数据 。 关 系数 据 库 通 过 在 表 中 存储 数据 来 达到 这 种 功效 。 这 些 表 代 表 业 务 类 ， 
类 中 的 属性 成 为 表 中 的 列 ， 而 每 一 行 代表 其 中 一 个 对 象 的 数据 。 因 此 ， 当 你 与 用 户 交谈 并 开 
始 确定 要 收集 的 数据 时 ， 需 要 将 它们 组 织 成 类 。 尽 管 这 一 过 程 并 不 困难 ， 但 仍 需 仔细 对 待 。 
数据 表 需 要 满足 某 些 需 求 。 

类 是 相互 关联 的 ， 它 最 后 变 成 表 。 例 如 ， 销 售 类 包含 一 个 属性 用 于 确定 参与 某 次 消费 的 客 
户 ， 因 此 客户 类 是 与 销售 类 相连 的 。 在 类 图 中 ， 这 种 关系 表示 为 连接 这 两 个 类 的 一 条 线段 。 
这 些 关系 具有 一 个 数值 包含 附加 的 业务 信息 。 在 客户 /销售 例子 中 ， 大 部 分 公司 有 一 条 规则 ， 
那 就 是 一 次 销售 活动 只 涉及 一 位 客户 ， 而 一 位 客户 可 以 参与 多 个 销售 活动 。 因 此 ， 客 户 表 和 






法 
(对 于 数据 库 是 可 选 的) 


Add Customer 方 
< 
Delete Customer 
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销售 表 间 具有 一 对 多 的 关系 。 这 些 关系 对 设计 数据 库 非常 关键 。 
2.4.4 定义 


要 学 习 如 何 创建 有 用 和 高 效 的 数据 库 ， 需 要 理解 一 些 基本 定义 。 主 要 的 定义 如 图 2-4 所 示 。 
E. F Codd 在 定义 关系 数据 库 时 给 出 了 这 些 术语 的 形式 数学 定义 ， 这 些 形式 定义 在 第 3 章 的 附录 
中 描述 。 然 而 ， 对 于 设计 和 建立 商业 应 用 来 说 ， 这 里 提出 的 定义 更 容易 理解 。 


主 码 属性 






Employee 


图 2-4 基本 数据 库 定 义 。Codd 提 出 了 很 多 形式 术语 和 数学 定义 ， 但 这 些 更 容易 
理解 。 数 据 表 中 的 一 行 代表 一 个 单独 的 对 象 ， 在 当前 情况 下 是 某 个 特定 
雇员 。 每 列 (属性 ) 包含 关于 该 雇员 的 一 条 数据 


关系 数据 库 是 谨慎 定义 的 表 的 集合 。 表 是 用 于 描述 实体 的 列 (属性 或 特性 ) 的 集合 。 单 独 
的 对 象 作为 行 ( 元 组 ) 存储 在 表 中 。 例 如 ，EmployeeID 12512 代 表 一 个 雇员 的 实例 ， 作 为 雇 
员 表 中 的 一 行 来 存储 。 属 性 (特性 ) 是 实体 的 特征 或 描述 符 。 关 系数 据 库 的 两 个 重要 方面 是 
(1) 所 有 数据 必须 存储 在 表 中 ，(2) 所 有 表 必 须 谨慎 定义 以 提供 灵活 性 并 将 问题 减 到 最 少 。 
数据 规范 化 是 适当 定义 表 的 过 程 ， 利 用 它 来 提供 灵活 性 、 最 小 化 元 余 ， 并 保证 数据 完整 性 。 
数据 库 设 计 和 数据 规范 化 的 目标 是 创建 一 系列 适当 的 表 。 每 个 表 描 述 企业 内 部 一 种 单独 的 对 
象 类 型 。 


2;4.5 主 码 


每 个 表 必 须 有 一 个 主 码 。 主 码 是 确定 某 一 特定 行 的 列 或 列 的 集合 。 例 如 ， 在 客户 表 中 ， 可 
能 会 使 用 客户 姓名 来 查找 某 一 条 目 。 但 那 列 并 不 是 很 好 的 主 码 。 如 果 有 八 位 客户 都 叫 John 
Smith 怎 么 办 ? 大 部 分 情况 下 ， 会 创建 单独 的 主 码 以 保证 它们 是 惟一 的 。 例 如 ， 通 常 创建 一 位 
客户 标识 符 来 确保 正确 区 分 所 有 客户 。 主 码 和 数据 的 其 余部 分 之 间 是 一 对 一 的 关系 。 换 句 话 
说 ， 每 一 个 主 码 代表 的 条 目 指向 确定 的 某 个 客户 行 。 为 了 强调 主 码 ， 组 成 主 码 的 列 的 名 称 会 
加 下 划 线 。 

在 某 些 情况 下 主 码 的 组 成 会 有 几 种 选择 。 在 客户 例子 中 ， 你 可 以 选择 姓名 或 电话 号 码 或 创 
建 一 个 惟一 的 CustomerID 。 你 的 选择 应 使 组 成 惟一 标识 符 所 需 列 的 集合 最 小 。 

某 些 美国 企业 可 能 会 对 使 用 个 人 社会 保障 号 码 (SSN) 作为 主 码 感 兴趣 。 即 使 你 需要 收集 
SSN， 也 最 好 使 用 一 个 单独 的 数字 作为 主 码 。 一 个 原因 是 主 码 必须 永远 惟一 ， 而 使 用 SSN 你 会 
冒 一 定 风险 ， 因 为 某 人 可 能 会 提供 一 份 伪造 的 文档 。 另 外 ， 主 码 在 数据 库 中 的 很 多 地 方 使 用 
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和 显示 。 如 果 你 使 用 SSN， 太 多 的 雇员 将 会 访问 客户 的 私有 信息 。 由 于 SSN 用 于 很 多 金融 的 、 
政府 的 和 健康 记录 ， 你 应 当 通过 限制 雇员 访问 这 些 号 码 来 保护 客户 的 隐私 。 

主 码 最 重要 的 问题 是 它 只 能 指向 数据 库 中 的 一 行 或 一 个 对 象 。 例 如 ， 假 设 你 在 为 人 力 资源 
管理 部 门 建立 数据 库 。 经 理 告诉 你 公司 用 姓名 确定 雇员 。 你 问 是 否 有 两 个 雇员 具有 相同 的 姓 
名 ， 经 理 查看 雇员 列表 并 告诉 你 已 有 的 30 名 雇员 里 没有 重 名 的 。 经 理 还 提出 如 果 你 将 雇员 姓 
名 中 间 的 首 字母 加 入 进去 ， 确 认 雇 员 将 永远 不 会 存在 问题 。 这 样 看 来 ， 姓 名 似乎 可 用 作 主 码 。 
但 请 等 一 下 ! 实际 上 你 需要 询问 将 来 主 码 的 值 可 能 是 多 少 。 如 果 你 使 用 雇员 姓名 作为 主 码 建 
立 数 据 库 ， 你 实际 上 明确 假设 雇员 从 不 会 重 名 。 毫 无 疑问 ， 这 种 假设 在 将 来 会 引起 问题 。 

本 质 上 ， 类 图 和 数据 表 代 表 相 同 的 概念 。 本 章 更 详细 地 讨论 类 图 ， 而 第 3 章 会 详细 介绍 将 
其 转化 为 数据 表 。 有 目前 ， 我 们 关注 业务 类 和 它们 的 关系 ， 这 些 关系 由 业务 规则 定义 。 


2.5 类 图 


DBMS 方 法 关注 数据 。 在 很 多 企业 中 数据 保持 相对 稳定 。 例 如 ， 公 司 现在 收集 的 有 关 客 户 
的 基本 数据 与 它们 20 年 前 或 30 年 前 收集 的 相同 。 例 如 姓名 、 地 址 和 电话 号 码 这 样 的 基本 信息 
总 是 会 需要 的 。 尽 管 现在 你 可 能 会 选择 收集 额外 的 数据 (例如 ， 手 机 号 码 和 互联 网 地 址 )， 但 
你 仍然 要 使 用 相同 的 基本 数据 。 而 另 一 方面 ， 公 司 接受 和 处 理 销售 订单 的 方式 随时 在 改变 ， 
因此 ， 表 单 和 报表 需要 不 断 修改 。 数 据 库 方法 通过 关注 正确 定义 的 数据 来 对 付 这 种 不 同 。 这 
样 ，DBMS 便 能 很 容易 改变 报表 和 表单 。 任 何 设计 的 第 一 步 都 是 确定 你 希望 观察 和 跟踪 的 事物 
或 实体 。 
2.5.1 类 和 实体 


在 阐述 模型 之 前 最 好 先 定义 一 些 术 语 。 基 本 的 定义 在 图 2-5 中 给 出 。 注 意 ， 这 些 定义 是 非 
正式 的 。 每 个 条 目 根据 Codd 的 关系 模型 都 有 一 个 更 加 形式 化 的 定义 ， 在 统一 建 模 语言 (UML) 
中 还 有 更 准确 的 语义 学 的 定义 。 然 而 ， 不 需要 这 些 数学 基础 知识 也 能 开发 数据 库 。 


宠物 商店 例子 






















现实 世界 中 你 希望 描述 或 跟踪 的 事物 Customer, Merchandise, Sales 

具有 属性 (特性) 和 行为 (方法 ) 的 实体 描述 Customer, Merchandise, Sale 

具有 特定 数据 的 类 的 对 象 Joe Jones, Premium Cat Food, Sale #32 

类 或 实体 的 特征 或 描述 符 LastName, Description, SaleDate 

类 执行 的 函数 AddCustomer UpdateInventory, ComputeTotal 


两 个 或 多 个 类 之 间 的 关系 每 次 销售 活动 只 涉及 一 位 客户 





”图 2-5 基本 定义 。 这 些 术语 描述 了 创建 类 图 所 需 的 主要 概念 。 第 一 步 是 确定 业 
务实 体 及 其 属性 。 在 数据 库 背 景 下 ， 方 法 不 如 属性 重要 ， 但 你 应 当 确定 
重要 的 函数 或 计算 方法 


要 设计 数据 库 ， 必 须 理 解 类 、 属 性 和 关联 之 间 的 区 别 。 你 的 解决 方案 取决 于 业务 如 何 对 应 
实体 以 及 需要 收集 什么 数据 。 例 如 ， 考 虑 一 个 雇员 。 很 明显 雇员 是 一 个 单独 的 实体 ， 因 为 你 
总 要 记录 雇员 的 详细 信息 (雇佣 日 期 、 姓 名 、 地 址 等 )。 但 雇员 的 配偶 昵 ? 是 将 其 作为 雇员 实 
体 的 一 个 属性 ， 还 是 一 个 单独 的 实体 ? 如 果 企 业 只 关心 配偶 的 姓名 ， 那 么 可 以 将 其 作为 雇员 
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实体 的 一 个 属性 储存 。 而 相反 ， 如 果 企 业 希 望 记录 关于 配偶 的 额外 信息 (例如 ， 生 日 和 职业 )， 
那么 创建 一 个 单独 的 拥有 自身 属性 的 配偶 实体 更 好 一 些 。 你 设计 数据 库 的 第 一 步 应 当 是 确定 
实体 和 定义 它们 的 属性 ， 第 二 步 是 指出 这 些 实体 之 间 的 关系 。 


2.5.2 关联 和 关系 


设计 数据 库 的 重要 步骤 是 确定 实体 间 的 关联 或 关系 。 这 些 关 系 的 详细 信息 代表 了 业务 规 
则 。 正 确 确定 这 些 业 务 关系 非常 关键 。 实 体 通 常 与 其 他 实体 相关 。 类 似 地 ， 一 个 实体 中 的 属 
性 可 以 与 其 他 属性 相关 。 关 联 或 关系 代表 了 业务 规则 。 例 如 ， 很 明显 ， 一 位 客户 可 以 提交 多 
个 订单 。 但 相反 方向 的 关系 就 不 是 很 明显 。 在 某 一 订单 中 可 以 包含 多 少 位 客户 ? 很 多 业务 会 
回答 说 每 个 订单 只 能 来 自 一 位 客户 。 而 另 一 方面 ， 某 些 企业 可 能 允许 一 个 订单 包含 多 位 客户 ， 
这 就 是 所 谓 的 多 对 多 的 关系 。 

关联 可 以 命名 : UML 指 所 谓 的 关联 角色 。 二 元 关联 的 每 一 端 都 可 以 标记 。 通 常 使 用 箭头 
来 指明 应 当 如 何 理解 标记 。 图 2-6 说 明 如 何 指明 一 位 客户 可 以 提交 多 个 订单 。 

统一 建 模 语言 使 用 数字 和 星 号 来 指明 关联 的 重复 度 。 如 图 2-6 所 示 ， 星 号 〈*) 代表 多 个 。 
因此 ， 每 个 供应 商 可 以 接受 多 个 订单 。 一 些 较 老 的 实体 关系 设计 方法 使 用 多 个 箭头 或 用 字母 M 
和 N 来 表示 关系 中 的 “多 个 ”一 方 。 





< 被 送 往 
图 2-6 关联 。 实体 间 有 三 类 关系 (一 对 一 ， 一 对 多 和 多 对 多 )。 它 们 可 以 用 多 种 方 

式 描述 、 但 它们 代表 业务 或 企业 规则 。 在 模糊 的 定义 中 几乎 任何 关系 都 可 以 

划分 为 多 对 多 的 关系 ， 应 当 避 兔 这 种 定义 ， 它 们 使 数据 库 设计 更 复杂 


正确 确定 关系 对 于 设计 数据 库 应 用 是 十 分 重要 的 。 记 住 ， 关 系 由 业务 规则 决定 ， 因 此 与 用 
户 交 谈 ， 仔 细 确 定 这 些 关 系 是 很 重要 的 。 当 你 从 用 户 那里 收集 表单 和 报表 时 ， 仔 细 检 查 它 们 
并 确定 最 初 的 实体 一 例如 客户 、 订 单 和 产品 。 然 后 与 用 户 交谈 ， 确 定 业务 如 何 处 理 这 些 实体 
之 间 的 关系 。 

要 确保 了 解 建立 两 个 类 之 间 的 关系 或 关联 的 重要 性 。 例 如 ， 客 户 /销售 关联 的 业务 规则 表 
示 : 只 有 当 某 位 客户 的 数据 已 经 在 客户 表 中 存在 时 ， 该 客户 才能 加 入 到 销售 活动 中 。 


2.5.3 类 图 细节 


类 图 是 企业 中 的 类 和 关联 的 视觉 模型 。 这 些 类 图 有 很 多 选项 ， 但 基本 功能 必须 包含 框 中 的 
类 名 (实体) 和 连接 它们 的 线段 (关系 ) 。 一 般 地 ， 你 希望 包含 关于 类 和 关联 的 信息 越 多 越 好 。 
例如 ， 你 最 终 会 希望 在 框 里 面包 含 类 的 属性 。 

关联 也 有 一 些 选项 。 数 据 库 设计 最 重要 的 问题 之 一 是 关系 的 重复 度 ， 包 括 两 个 方面 : (1) 


多 2 草 ” 据 摩 朗 计 33 


可 以 关联 的 对 象 的 最 大 数目 ，(2) 如 果 有 ， 必 须 包含 的 对 象 的 最 小 数目 。 如 图 2-6 所 示 ， 重 复 
度 由 最 小 值 、 省 略 号 〈.…) 和 最 大 值 表示 。 星 号 (*) 代表 未 知 的 数量 。 在 图 2-6 的 例子 中 ， 只 
有 一 位 客户 (1...1) 能 涉及 零 到 多 个 (0...*) 销售 活动 中 。 

很 多 时 候 ， 关 系 需 要 相关 联 的 两 个 实体 都 存在 。 例 如 ， 如 果 你 的 销售 表单 中 列 出 了 一 位 客 
户 ， 但 在 文件 中 不 存在 该 客户 的 数据 时 将 会 怎样 ? 订单 和 客户 实体 之 间 有 一 个 参照 关系 。 业 
务 规则 要 求 客 户 数据 必须 已 经 存在 ， 该 客户 才能 购物 。 
这 个 关系 可 以 通过 指定 关系 的 最 小 值 (如 果 是 可 选 的 则 
为 0， 如 果 是 必须 的 则 为 1) 来 表示 。 

一 定 要 在 两 个 方向 上 理解 关系 。 例 如 , 在 图 2-7 中 ， 
客户 /销售 关联 的 第 二 个 部 分 声明 ， 一 位 客户 可 以 提 
交 零 个 或 多 个 销售 订单 。 换 句 话说， 客户 可 以 不 提交 
订单 。 

往 下 看 类 图 ， 注 意 销售 和 产品 之 间 的 多 对 多 关系 
(在 两 个 类 的 右边 都 有 *)。 一 个 销售 活动 必须 包含 至 少 
一 件 产 品 ( 空 订单 在 业务 中 无 效 )， 但 公司 也 可 能 有 某 图 2-7 类 图 或 实体 关系 图 。 每 位 客户 可 





产品 还 未 卖 出 去 过 一 件 。 以 提交 零 个 或 多 个 订单 。 每 次 销 
1. 关联 细节 : 多 重 关联 售 活动 必须 仅仅 来 自 一 位 客户 。 
在 数据 库 设计 中 ， 类 之 间 的 多 对 多 关系 会 引发 问题 。 等 〈0) 代表 可 选项 ， 因 此 , 一 


位 客户 可 以 未 提交 任何 订单 
它们 在 初始 类 图 中 是 可 接受 的 ， 如 图 2.8 所 示 ， 但 它们 最 A 


终 必须 被 划分 成 一 对 多 的 关系 。 这 个 过 程 及 其 原因 在 第 3 章 详细 介绍 。 

如 图 2-8 所 示 ， 在 关联 的 情形 下 ， 实 体 并 非 总 是 明显 的 。 考 虑 一 个 基本 的 制造 业 环境 ， 其 
中 雇员 将 组 件 装配 成 最 终 产品 。 竺 一 看 ， 图 中 有 三 个 实体 : 雇员 、 组 件 和 产品 。 这 个 设计 指 
明 数据 库 应 当 明示 生产 每 件 产品 的 雇员 和 构成 每 件 产品 
的 组 件 。 注 意 ， 存 在 两 个 多 对 多 关系 。 

要 理解 多 对 多 关系 所 引发 的 问题 ， 考 虑 当 公司 想 知 
道 各 个 组 件 由 哪 位 雇员 装配 成 产品 时 会 怎样 ?要 处 理 这 
种 情况 ， 图 2-9 中 的 三 个 主要 实体 (和 雇员、 产品 和 组 件 ) 
实际 上 通过 Assembly 关 联 互 相 联 系 。 当 多 于 两 个 类 相互 
关联 时 ， 这 种 关系 称 为 多 重 关联 ， 用 姜 形 表示 。 这 种 关 
联 (实际 上 任何 关联 ) 可 以 用 其 自身 的 类 数据 来 描述 。 ”|[、 
在 这 个 例子 中 ,装配 列表 中 的 一 个 条 目 会 包含 EmployeeID、 





图 2-8 多 对 多 关系 引发 数据 库 中 的 问 


ComponentID 和 ProductID 。 总 之 ， 多 个 雇员 可 以 装配 多 题 。 在 这 个 例子 中 ， 多 个 雇员 将 
个 产品 ， 多 个 组 件 可 以 装配 到 多 个 产品 上 。 每 个 独立 事 多 个 组 件 装配 到 多 个 产品 上 ， 但 
件 由 Assembly 关 联 类 记录 。Assembly 关 联 能 解决 多 对 多 我 们 并 不 知道 哪个 雇员 实际 装配 
的 问题 ， 这 是 因为 Assembly 类 的 每 行 保存 了 某 一 雇员 、 | 


某 一 组 件 和 某 一 产品 的 数据 。 在 实际 生活 中 可 能 还 会 有 Date/Time 列 ， 用 于 记录 每 个 事件 发 生 的 
时 间 。 
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图 2-9 多 对 多 关联 转化 为 具有 多 重 关联 的 一 对 多 关系 集合 ， 此 多 重 关联 包含 一 个 新 
类 。 在 此 例 中 ，Assembly 类 的 每 行 存储 一 个 雇员 、 一 个 组 件 和 一 个 产品 的 数 
据 。 注 意 ，Assembly 类 ( 框 ) 由 虚线 与 Assembly 关 联 (菱形 ) 相连 接 


根据 UML 标 准 ， 重 复 度 在 多 重 关联 背景 下 没有 意义 。 类 上 放置 的 重复 度数 字 代表 当 关联 
中 其 他 n 一 1 个 值 确定 时 ， 关联 中 可 能 的 对 象 数目 。 例如， 如 果 ComponentID 和 EmployeeID 确 定 ， 
将 会 有 多 少 产品 ? 换 句 话说 ， 一 个 雇员 能 将 相同 组 件 装配 到 多 个 产品 中 吗 ? 在 大 多 数 情况 下 ， 
答案 为 “是 的 "， 因 此 重复 度 一 般 会 是 一 个 表示 “多 个 ”的 星 号 。 

最 终 ， 所 有 的 多 对 多 关系 必须 通过 添加 新 实体 转化 为 一 对 多 关系 的 集合 。 像 Assembly 实 
体 一 样 ， 这 个 新 实体 一 般 代 表 一 种 活动 ， 并 且 包 括 一 个 Date/Time 时 间 蕉 。 

作为 设计 者 你 会 将 类 图 用 作 不 同 的 用 途 。 有 时 你 需要 查看 细节 ， 其 他 时 候 你 只 关心 整体 。 
对 于 大 型 项 目 ， 有 时 用 于 创建 概要 图 ， 显 示 主 要 类 之 间 的 基本 关系 。 在 这 种 图 中 可 以 使 用 多 
对 多 关系 来 隐藏 某 些 细节 实体 。 

2. 关联 细节 : 聚集 

关联 中 的 一 些 特 殊 类 型 经 常 出 现 ，UML 定 义 了 专门 方法 来 处 理 它们 。 其 中 一 类 就 是 双 集 
或 集合 。 例 如 ，Sale 包 括 购买 的 Items 的 集合 。 
如 图 2-10 所 示 ， 聚 集 由 置 于 关联 线 上 靠近 类 
的 小 菱形 表示 ， 该 类 是 集合 体 。 在 此 例 中 ， es 
菱形 靠近 Sale 类 。 具 有 “多 ”关系 的 关联 可 
以 有 序 或 无 序 。 在 此 例 中 ，Items 存 储 的 顺序 ”图 2-10 关联 聚集 。Sale 包 含 购买 的 很 多 商品 。 在 关 
无 关 紧 要 。 如 果 顺 序 有 关系 ， 则 只 需 在 关联 联 上 放置 一 个 小 萎 形 来 表示 这 种 特殊 的 关系 
下 面 放置 {ordered} 标 记 即 可 。 要 确保 在 描述 词 的 两 侧 加 上 大 括号 。 

3. 关联 细节 : 组 合 

简单 的 聚集 表示 在 业务 环境 中 并 不 常用 。 然 而 ， 组 合 是 一 种 更 强 的 聚集 关联 ， 它 出 现 得 更 
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多 。 在 组 合 中 ,单独 的 项 成 为 新 对 象 。 考 虑 自行 车 ， 它 由 组 件 的 集合 〈 和 车轮、 曲柄 和 车 闸 等 ) 
构成 。 统 一 建 模 语 言 提供 两 种 方式 显示 组 合 。 图 2-11 中 ， 单 独 的 类 是 分 开 的 ， 并 以 填充 的 菱形 
标记 。 另 一 种 可 选 的 显示 方法 如 图 2-12 所 示 ， 它 通过 将 组 件 类 绘制 在 主要 的 Bicycle 类 中 来 表 
示 组 合 。 在 内 媒 的 图 中 更 容易 看 出 关系 ， 但 如 果 需 要 20 个 不 同 的 对 象 来 定义 自行 车 ， 那 么 表 
示 起 来 将 会 非常 混乱 。 


Size 
Model type 






1 builtfrom»> 2 











图 2-11 关联 组 合 。 一 辆 自行 车 由 很 多 单独 的 零 。 图 2-12 关联 组 合 。 通 过 将 组 件 项 幅 套 在 主 类 中 
部 件 组 成 。 这 些 零 部 件 不 再 单独 存在 ， 更 容易 查看 组 合 
它们 变 成 了 自行 车 

聚集 和 组 合 之 间 的 区 别 很 小 。UML 标 准 规定 组 合 只 能 表示 一 对 多 关系 。 任 何 多 对 多 关联 
必须 使 用 简单 的 聚集 指示 符 。 组 合 关系 一 般 比 聚集 关系 容易 确认 ， 它 们 在 制造 业 环境 中 更 通 
用 。 只 要 记 住 ， 仅 当 单独 的 项 成 为 新 类 时 组 合 才 存 在 。 完 成 自行 车 制造 后 ， 就 不 再 涉及 单独 
的 组 件 。 

4. 关联 细节 : 概括 . 

业务 环境 中 出 现 的 另 一 通用 关联 是 概括 。 在 这 种 情况 下 产生 一 个 类 层次 。 最 一 般 的 描述 在 
顶端 给 出 ， 然 后 更 特殊 的 类 从 它 派生 。 图 2-13 显 示 了 Sally 的 宠物 商店 中 的 例子 。 每 种 动物 都 
有 某 些 一 般 的 属性 (例如 ，DataBorn、Name，Gender 和 ListPrice)， 包含 在 一 般 的 Animal 类 中 。 
但 特别 的 动物 类 型 需要 一 些 不 同 的 信息 。 例 如 ， 对 于 哺乳 动物 (或 许 是 猫 ) ， 买 主 希 望 了 解 它 
的 宝 的 大 小 以 及 动物 是 否 有 爪子 。 另 一 方面 ， 鱼 没有 爪子 ， 用 户 希 望 了 解 不 同 的 信息 ， 例 如 
它们 是 淡水 鱼 还 是 成 水 鱼 以 及 鳞 的 情况 。 对 每 种 动物 都 可 以 收集 同类 动物 相关 数据 。 每 一 代 
有 多 个 阶段 在 宠物 商店 例子 中 ，Memmal 种 类 可 以 进一步 划分 为 Cat、Dog 和 其 他 种 类 。 

使 用 小 的 、 未 填充 的 三 角形 来 表示 概括 关系 。 可 以 将 所 有 子 类 连接 至 一 个 三 角形 ， 如 图 2-13 
所 示 ， 也 可 以 分 别 绘制 每 条 线段 。 对 于 此 例 的 情形 ， 汇 集 的 表示 方法 是 最 好 的 选择 ， 因 为 ， 
此 关联 代表 了 一 个 不 相交 ( 互 斥 ) 的 集合 。 一 种 动物 只 可 能 属于 某 一 子 类 。 

概括 的 一 个 重要 属性 是 低层 类 继承 高 层 类 的 属性 和 方法 。 类 通常 起 始 于 相当 一 般 的 描述 。 
更 细节 的 类 从 这 些 基 类 派生 。 每 个 低层 类 从 高 层 类 继承 属性 和 函数 。 继 承 意味 着 派生 类 的 对 
象 除了 具有 它们 自身 类 中 定义 的 属性 外 ， 还 具有 高 层 类 的 所 有 属性 。 相 似 地 ， 在 相关 类 中 定 
义 的 函数 对 于 新 类 也 是 有 效 的 。 

考虑 图 2-14 所 示 的 银行 账户 系统 的 例子 。 设 计 者 会 从 客户 账户 的 基本 描述 开始 。 银 行 总 需 
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要 其 账户 的 基本 信息 ， 例 如 AccountID、CustomerID、DateOpened 和 CurrentBalance。 相 似 地 ， 
会 有 公共 函数 包括 开通 账户 和 关闭 账户 。 所 有 这 些 基本 属性 和 操作 会 在 基 类 Accounts 中 定义 。 


{disjoint} 





图 2-13 关联 概括 。 一 般 的 Animal 类 保存 适用 于 所 有 动物 的 数据 。 派 生 的 子 类 
包含 特定 于 某 一 物种 的 数据 
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图 2-14 类 继承 。 对 象 类 起 源 于 一 个 基 类 (例如 Account)。 其 他 类 从 基 类 继承 
而 来 。 它 们 继承 基 类 的 属性 和 方法 ， 并 添加 新 的 属性 。 在 银行 中 ， 所 
有 账户 都 需要 跟踪 基本 的 客户 数据 。 只 有 支票 账户 需要 跟踪 透支 费用 


新 账户 可 以 由 这 些 账户 派生 ， 设 计 者 只 需 添加 新 功能 一 一 这 样 便 能 节省 时 间 和 减少 错误 。 
例如 ，Checking Accounts 具 有 MinimumBalance 以 避免 费用 ， 银 行 必须 跟踪 每 个 月 Overdraft 的 
次 数 。Checking Accounts 类 派生 自 Accounts 基 类 ， 开 发 者 添加 新 的 属性 和 函数 。 这 个 新 类 自动 
从 Accounts 类 继承 所 有 属性 和 函数 ， 因 此 不 必 重 新 定义 它们 。 相 似 地 ， 银 行 对 储蓄 存款 账户 感 
兴趣 ， 因 此 ， 创 建 Savings Accounts 类 ， 它 记录 当前 的 InterestRate 并 包括 一 个 函数 用 于 计算 和 
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存储 每 月 应 得 的 利息 。 

其 他 类 可 以 从 Savings Accounts 和 Checking Accounts 类 派生 。 例 如 ， 银 行 可 能 为 年 长 者 和 
学 生 设立 专门 的 支票 账户 。 这 些 新 账户 可 能 提供 较 低 的 费用 、 不 同 的 最 小 余额 需求 或 不 同 的 
利率 。 要 适应 这 些 修改 ， 设 计 图 只 需 通过 在 这 些 初 始 定义 下 面 添加 新 类 进行 扩展 。 这 些 图 显 
示 了 类 层次 ， 类 层次 表示 类 如 何 相 互 派 生 ， 并 突出 哪些 属性 和 函数 被 继承 。UML 使 用 不 封口 
的 菱形 箭头 表示 高 层 的 类 是 更 一 般 的 类 。 例 如 ，Savings Accounts 和 Checking Accounts 类 派生 
自 一 般 的 Accounts 类 ， 因 此 ， 关 联 线段 从 前 者 指向 后 者 。 

图 2-14 中 的 每 个 类 也 能 执行 独立 的 函数 。 在 类 中 定义 属性 和 方法 称 为 封装 。 它 的 优点 在 于 
将 所 有 相关 定义 放 在 一 个 地 方 。 由 于 属性 和 函数 可 以 在 应 用 的 其 他 部 分 受到 保护 ， 因 此 封装 
还 提供 了 一 些 安全 和 控制 功能 。 

注意 ，Accounts 类 有 一 个 用 于 关闭 账户 的 函数 ,从 这 里 可 以 看 出 封装 的 另 一 个 有 趣 的 属性 。 
仔细 观察 ， 你 会 发 现 Checking Accounts 类 也 有 一 个 函数 用 于 关闭 账户 (CloseAccount)。 当 派 
生 类 定义 了 与 父 类 相同 的 函数 ， 称 为 多 态 性 。 当 系统 激活 此 函数 时 ， 会 自动 确定 对 象 的 类 并 
执行 匹配 的 函数 。 设 计 者 也 能 指定 派生 的 函数 (Checking Accounts 类 中 的 CloseAccount 方 法 ) 
可 以 调用 基 类 中 的 相关 函数 。 在 银行 业务 的 例子 中 ，Checking Account 类 的 CloseAccount 函 数 
会 取消 未 兑现 支票 、 计 算 当 前 费用 ， 并 更 新 主要 的 余额 。 然 后 它 会 调用 Accounts 类 的 
CloseAccount 函 数 ， 这 个 消 数 会 自动 将 数据 存档 并 从 当前 记录 中 删除 对 象 。 

多 态 性 对 于 应 用 建立 者 来 说 是 有 用 的 工具 。 它 意味 着 可 以 调用 一 个 函数 而 不 管 数据 的 类 
型 。 在 银行 业务 例子 中 ， 可 以 简单 地 调用 CloseAccount 函 数 。 为 响应 调用 ， 不 同 的 账户 会 执行 
不 同 的 操作 ， 但 应 用 并 不 关心 。 应 用 的 复杂 性 转移 到 了 设计 阶段 (在 那里 定义 所 有 类 )。 应 用 
建立 者 不 必 关 心细 节 。 

注意 ， 在 复杂 情况 下 ， 一 个 子 类 可 以 从 多 个 父 类 继承 属性 和 方法 。 在 图 2-15 中 ， 小 汽车 是 
自动 化 的 ， 并 且 设 计 为 上 路 倍 用 ， 因此 它 从 两 个 类 (还 从 一 般 的 Vehicle 类 ) 中 继承 属性 。 自 

行车 的 情况 稍微 复杂 一 些 ， 因 为 它 可 以 从 On-Road 类 或 从 Off-Road 类 继承 属性 ， 这 取决 于 自行 
车 的 类 型 。 如果 你 要 记录 混合 型 自行 车 的 数据 ， Bicycle 类 必须 从 On-Road 和 Off-Road 这 两 个 类 
继承 数据 。 





图 2-15 多 重 父 类 。 类 可 以 从 若干 父 类 继承 属性 。 关 键 在 于 绘制 结构 以 便 用 户 
能 够 理解 并 确保 绘制 的 结构 符合 业务 规则 
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5. 关联 细节 : 自 反 关联 

自 反 关系 是 业务 中 产生 的 需要 特殊 处 理 的 另 一 种 情况 。 自 反 关 联 是 类 到 其 自身 的 关系 。 最 
通用 的 业务 情形 如 图 2-16 所 示 。 一 些 雇员 是 管理 
者 ， 他 们 管理 其 他 雇员 。 这 样 就 会 有 从 雇员 ( 管 
理 者 ) 回 到 雇员 (工人 ) 的 关联 。 注 意 ，UML 如 
何 允许 你 在 关系 (管理 者 和 工人 ) 的 两 端 进行 标 
记 。 另 外 ,，” 基 manages” 标 签 指明 应 该 如 何 识别 
关联 。 标 签 和 文字 阐明 了 关联 的 目的 。 某 些 关联 
可 能 不 需要 标注 ， 但 自 反 关联 总 是 应 当 仔细 说 明 。 

6. 关联 细节 : 小 结 

最 后 这 几 节 描 述 的 不 仅仅 是 给 你 的 类 图 做 一 
点 变化 。 它 们 描述 了 通用 业务 状况 。 你 需要 确认 ”图 216 自 反 关 系 。 管 理 者 是 管理 其 他 员工 的 雇 
这 些 状况 ， 因 为 它们 会 影响 你 设计 和 构建 数据 库 i 
应 用 的 方法 。 要 创建 类 图 ， 首 先 确定 主要 的 类 ， 包 括 它们 的 属性 。 然 后 注意 这 些 类 之 间 的 关 
联 ， 特 别 要 注意 正确 的 重复 度 。 一 定 要 警惕 多 对 多 关系 。 当 你 看 到 它们 时 ， 寻 找 多 重 关联 或 
者 能 提供 一 对 多 关系 的 新 类 。 寻 找 组 合 或 聚集 的 情况 。 是 否 一 个 类 由 很 多 小 对 象 组 成 ?如 果 
是 ， 那 么 考虑 主 类 中 嵌入 的 子 类 。 注 意 概括 的 例子 。 是 否 有 相同 目的 的 类 ? 如 果 有 ， 试 着 定 
义 一 个 一 般 的 类 并 使 用 继承 派生 这 些 细节 的 类 。 注 意 不 相交 (或 互 斥 ) 的 类 。 确 保 在 图 中 指 
明 它 们 。 最 后 ， 寻 找 自 反 关联 ， 在 自 反 关联 中 ， 一 个 类 的 对 象 与 相同 类 中 的 其 他 对 象 关联 。 
在 Employee 类 中 查找 这 种 关系 ， 但 它 可 能 出 现在 其 他 类 中 。 例 如 ， 公 司 可 以 生产 某 种 产品 ， 
而 这 种 产品 由 其 他 产品 构成 。 

此 时 ， 你 不 必 绘 制 一 个 完美 的 类 图 ， 只 需 正确 确认 所 有 的 业务 规则 。 第 3 章 讲 解 如 何 分 析 
类 和 关联 ， 以 及 如 何 创建 更 好 的 类 集 。 


2.6 Sally 的 宠物 商店 类 图 


宠物 商店 的 主人 Sally 希 望 分 阶段 创建 应 用 程序 。 第 一 个 阶段 将 追踪 商店 的 基本 事务 数据 。 
因此 ， 你 需要 确认 宠物 商店 运营 中 的 主要 实体 。 

设计 宠物 商店 数据 库 应 用 的 第 一 步 是 与 其 主人 (Sally) 交谈 ， 调 查 其 他 商店 ， 确 定 所 需 
的 基本 组 件 。 在 与 Sally 交 谈 后 发 现 ， 这 个 宠物 商店 具有 一 些 与 其 他 零售 商店 不 同 的 功能 。 最 
重要 的 区 别 在 于 宠物 商店 必须 追踪 两 种 不 同 的 销售 类 型 : 对 动物 的 处 理 与 对 产品 的 处 理 不 同 。 
例如 ， 宠 物 商店 对 于 动物 要 追踪 更 细节 的 信息 。 另 外 ， 产 品 能 够 以 多 个 单位 销售 〈 例 如， 六 
饶 狗 食 ) ， 但 动物 必须 单独 追踪 。 图 2-17 显 示 了 Sally 的 宠物 商店 的 初始 类 图 ， 宠 物 商店 建立 在 
这 些 基 本 实体 之 上 。 类 图 突出 显示 了 动物 和 货物 的 两 条 不 同 路 径 。 

由 于 Sally 要 为 宠物 提供 好 的 去 处 ， 她 想 收 集 每 位 客户 的 详细 信息 。Sally 还 比 大 部 分 店主 
更 关注 供应 商 。 她 甚至 在 考虑 雇 人 去 调查 各 个 动物 饲养 者 。 调 查 人 员 会 提供 多 方面 的 报告 ， 
例如 清洁 程度 、 动 物 的 数目 、 驯 养 员 的 数目 、 每 餐 的 食物 类 型 和 兽医 照顾 的 质量 。 

当 与 Sally 交 流 的 时 候 ， 优 秀 的 设计 者 会 记录 下 将 要 包含 在 数据 库 中 的 数据 。 这 个 列表 由 
实体 组 成 ， 我 们 需要 收集 这 些 实体 的 数据 。 例 如 ， 对 于 宠物 商店 数据 库 ， 很 明显 需要 收集 客 
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manager 
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户 、 供 应 商 、 动 物 和 产品 的 数据 。 同 时 ， 需 要 记录 每 一 笔 购买 和 销售 信息 。 开 始 时 ， 要 确定 
这 些 实体 的 不 同属 性 或 特性 。 例 如 ， 客 户 具有 姓名 、 地 址 和 电话 号 码 。 对 于 每 个 动物 ， 要 了 
解 动物 的 类 型 ( 猫 、 狗 等 等 ) 、 品 种 、 出 生日 期 等 等 。 





图 2-17 宠物 商店 的 初始 类 图 。 动 物 的 购买 和 销售 与 货物 不 同 ， 因 此 这 个 商店 
需要 对 这 两 类 实体 记录 不 同 的 数据 


详细 类 图 会 包括 每 个 实体 的 属性 。 注 意图 2-17 所 示 的 初始 类 图 包含 几 个 多 对 多 关系 。 所 有 
这 些 都 需要 添加 中 间 类 。 考 虑 MerchandiseOder 类 。 一 次 可 以 订购 多 件 商品 ， 因 此 ， 你 将 创建 
一 个 新 实体 (OrderItem) ， 它 包含 每 个 MerchandiseOrder 订 购 的 所 有 商品 。AnimalOrder 和 Sale 
实体 的 作用 类 似 。 

图 2-18 给 出 了 宠物 商店 更 详细 的 类 图 ， 它 包含 这 些 新 的 中 间 类 。 它 还 包含 City、Breed 和 
Category 这 几 个 新 类 。 几 乎 在 每 个 业务 数据 库 中 邮政 编码 和 城市 都 会 引发 问题 。 城 市 和 邮政 编 
码 有 关 ， 但 并 非 一 对 一 的 关系 。 一 种 简单 的 解决 办 法 是 为 每 位 客户 和 供应 商 存储 城市 、 州 和 
邮政 编码 ， 然 而 ， 对 于 本 地 客户 来 说 ， 为 每 次 销售 存储 城市 和 州 的 名 称 是 非常 烦琐 的 。 一 个 
解决 办 法 是 在 单独 的 类 中 存储 城市 和 邮政 编码 数据 。 通 用 的 值 可 以 在 初始 时 输入 。 雇 员 可 以 
从 已 有 列表 中 选择 想 要 的 城市 而 不 必 重 新 输入 数据 。 

Breed 和 Category 类 用 于 确保 数据 的 一 致 性 。 文 本 数据 的 恼人 问题 之 一 是 人 们 输入 的 数据 
可 能 不 一 致 。 例 如 ， 有 些 职员 可 能 将 达尔 马 提 亚 狗 简写 为 Dal， 其 他 人 可 能 使 用 Dalma， 而 少 
数 人 可 能 输入 全 称 。 要 解决 这 个 问题 ， 我 们 希望 在 单独 的 类 中 一 次 性 存储 所 有 的 种 类 名 称 。 
这 样 雇员 只 需 从 这 些 类 存储 的 列表 中 选取 种 类 即 可 。 这 样 ， 每 次 输入 的 数据 便 都 一 致 。 

宠物 商店 的 概括 和 详细 的 类 图 都 可 以 用 来 与 用 户 交流 。 通 过 其 中 的 实体 和 关系 ， 类 图 显示 
了 公司 的 业务 规则 。 例 如 ， 分 别 对 待 动物 和 商品 对 于 店主 是 很 重要 的 。 同 样 ， 每 次 销售 中 只 
能 有 一 位 客户 也 是 重要 的 业务 规则 。 这 些 规则 应 由 Sally 确 认 。 如 果 一 个 家 庭 购买 了 一 只 动物 ， 
她 是 否 希望 了 解 这 个 家 庭 中 的 每 个 成 员 ? 如 果 是 ， 你 需要 添加 一 个 Family 类 列 出 每 位 客户 的 家 
庭 成 员 。 重 点 在 于 你 可 以 使 用 类 图 显示 新 系统 、 检 验 假设 、 获 得 新 想法 。 
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图 2-18 完 物 商店 的 详细 类 图 。 注 意 为 解决 多 对 多 问题 而 添加 的 新 表 : OrderItem、 
AnimalOrderItem、SaleItem 和 SaleAnimal。 添 加 City 表 来 减少 数据 条 目 。 添 加 
Breed 和 Category 表 来 保证 数据 一 致 性 。 用 户 从 这 些 表 中 选择 类 型 和 品种 ， 而 
不 是 输入 可 能 每 次 都 不 同 的 文字 或 缩写 。Microsoft Access 使 用 无 穷 大 符号 
(o ) 代替 星 号 〈*) 来 标记 关系 中 表示 多 数 的 一 边 


2.7 数据 类 型 ( 域 ) 


当 你 列 出 每 个 类 中 的 属性 时 ， 应 当 考虑 它们 是 什么 数据 类 型 。 每 个 属性 具有 一 个 特定 的 数 
据 类 型 或 数据 域 。 例 如 ，EmployeeID 是 什么 ? 它 是 数值 吗 ? 从 什么 值 开始 ? 怎样 递增 ? 它 包 
含 字母 或 其 他 数字 字符 吗 ? 你 必须 确定 每 个 属性 或 列 的 域 ， 图 2-19 给 出 了 一 些 通用 域 。 最 通用 
的 是 文本 ， 它 存储 字符 。 

注意 ， 任 何 域 都 可 以 保存 缺失 数据 。 用 户 并 不 总 知道 某 些 项 的 值 ， 因 为 它 可 能 未 输入 。 缺 
失 的 数据 由 空 值 定义 。 


2.7:1 文本 


文本 列 通常 限制 在 不 超过 255 个 字符 。 有 些 数 据 库 管理 系统 要 求 区 分 定 长 和 变 长 文本 。 定 
长 字符 捉 总 是 占用 你 分 配 的 空间 规模 ， 在 处 理 像 身 份 证 号 码 或 双 字母 州 缩写 这 样 的 短 字符 串 
方面 能 最 有 效 地 提升 速度 。 变 长 字符 串 存储 时 ， 它 们 只 占用 每 行 数据 实际 所 需 的 空间 。 

备注 或 注释 列 也 用 于 存储 变 长 文本 数据 。 不 同 于 变 长 文本 的 是 数据 库 中 备注 可 以 分 配 更 多 
的 空间 。 确 切 的 限制 取决 于 所 使 用 的 DBMS 和 计算 机 ， 但 备注 类 型 的 数据 库 列 一 般 大 至 32K 或 
64K。 备 注 列 一 般 用 于 长 注释 甚至 短 报表 。 然 而 ， 有 些 系统 限制 在 备注 列 上 执行 的 操作 ， 例 如 
不 允许 排序 备注 数据 。 
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Text 


fixed char, CHAR 

variable varchar VARCHAR2 
Unicode nchar, nvarchar NVARCHAR2 
memo text LONG 
Number 

Byte (8 bits) tinyint INTEGER 
integer (16 bits) smallint INTEGER 

Long (32 bits) int INTEGER 

(64 bits) bigint NUMBER(127,0) 





Fixed precision decimai(p,S) NUMBER(p,s) 
Float NUMBER, FLOAT 
Double NUMBER 


Currency NUMBER(38,4) 
Yes/No i INTEGER 


Date/Time Date/Time datetime DATE 
smalldatetime 
Interval NA interval year . . . INTERVAL YEAR . . . 


oOLE Object | image | LONG RAW BLOB 


AutoNumber AutoNumber Identity SEQUENCE 
rowguidcol ROWID 


图 2-19 数据 类 型 ( 域 ) 。 通 用 数据 类 型 及 其 在 三 个 数据 库 系 统 中 的 变化 。 在 
SQL Server 和 Oracle 中 以 “N” 开 头 的 文本 类 型 保存 Unicode 字 符 集 ， 
对 于 非 拉 丁 语言 特别 有 用 








2.7.2 数值 


数值 数据 也 很 通用 ， 计 算 机 认可 若干 不 同 种 类 的 数值 数据 。 对 于 数值 数据 列 ， 需 要 做 的 最 
重要 决定 是 在 整数 和 浮 点 数 之 间 进 行 选择 。 整 数 不 能 存储 分 数 〈 小 数 点 右边 的 值 ) 。 整 数 通 常 
用 于 计数 和 存储 诸如 1、2、100 和 5 000 这 样 的 值 。 浮 点 数 能 够 包含 分 数值 和 存储 像 3.141 59 和 
2.718 这 样 的 数字 。 

整数 和 浮 点 数 引 发 的 第 一 个 问题 是 ， 为 什么 要 关心 它们 ?为 什么 不 将 所 有 的 数字 作为 浮 点 
数 存储 ? 答案 在 于 计算 机 存储 两 种 数值 类 型 的 方式 。 特 别 地 ， 大 部 分 计算 机 用 2 (或 4) 字 节 
存储 每 个 整数 值 ， 但 用 4 (或 8) 字 节 存储 每 个 浮 点 数值 。 尽 管 2 字 节 的 差别 似乎 是 微不足道 的 ， 
但 当 数 据 有 几 百 万 行 时 会 产生 巨大 的 差异 。 此 外 ， 整 数 计算 本 质 上 要 快 于 浮 点 数 计算 。 简 单 
的 如 两 个 数字 相 加 ， 整 数 要 比 浮 点 数 快 10 到 100 倍 。 尽 管 计算 机 变 得 越 来 越 快 ， 存 储 成 本 也 一 
直 在 降低 ， 但 当 处 理 大 规模 数据 库 时 ， 性 能 仍然 是 一 个 重要 的 问题 。 如 果 可 以 将 一 个 数值 存 
储 为 整数 ， 那 么 尽量 这 样 存储 ， 你 会 获得 很 高 的 性 能 。 

大 部 分 系统 还 支持 长 整数 和 双 精 度 浮 点 数 。 这 两 种 情况 都 需要 双 倍 于 单 精度 数据 的 存储 空 
间 。 设 计 者 的 主要 问题 是 确定 用 户 所 需 数 值 和 精度 的 大 小 。 例 如 ， 如 果 预 期 有 100 000 客 户 ， 
那么 ， 不 能 使 用 整数 来 追踪 客户 〈 码 值 ) 。 注 意 ，16 位 整数 只 有 65 536 个 值 。 要 计算 或 度量 较 
大 的 值 ， 需 要 使 用 长 整数 ， 它 的 范围 在 +/--2 000 000 000 之 间 。 相 似 地 ， 浮 点 数 能 支持 6 位 有 
效 数 字 。 尽 管 量 值 〈( 团 ) 可 以 很 大 ,但 只 能 存储 六 位 或 七 位 数字 。 如 果 用 户 需要 更 高 的 精度 ， 
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那么 使 用 双 精 度 值 ， 它 能 存储 14 位 有 效 数 字 。 图 2-20 列 出 了 通用 数据 类 型 的 最 大 值 。 


数据 类 型 


Text (characters) 
fixed 

variable 
memo 











数据 规模 


8K, 4K 
255 8K, 4K 
2M, 1M 













如 hv 
大 天 































Numeric 









































Byte (8 bits) 255 255 38 digits 
Integer (16 bits) | +/~ 32 767 +/— 32 767 38 digits 
Long (32 bits) +/ 一 28 +/ 一 2B 38 digits 
(64 bits) NA 18 digits p: 38 digits 
Fixed precision NA +/— 1E 38 Pp: -84 to 127; 
s:1 to 38 
Float +/— 1E 38 +/— 1E 38 38 digits 
Doubte +/— 1 £ 308 +/~ 1 E 308 38 digits 
Currency +/— 900.000 0 trilion +/— 900.000 0 trillion 38 digits 
Yes/No 0/1 0/1 
1/1/1753 ~ 12/31/9999 (3 ms) | 1/1/—4712, 
1/1/1900 — 6/6/2079 (1 min) | 1/31/9999 (sec) 
rage oa 


AutoNumber Long (2 B) 28or18 digits with bigint Column: 38 digit 
maximum 


图 2-20 数据 规模 。 确 保 你 选取 的 数据 类 型 能 存储 你 将 过 到 的 最 大 值 。 选 取 过 大 的 尺寸 会 浪费 空 
间 和 降低 计算 速度 ， 但 如 果 不 确定 数据 大 小 的 话 ， 还 是 选取 较 大 的 尺寸 

很 多 商业 数据 库 遇 到 了 一 个 不 同 的 问题 。 货 币值 通常 需要 很 多 位 数 ， 而 且 用 户 不 能 容忍 四 
舍 五 人 的 错误 。 即 便 使 用 长 整数 ， 仍 会 限制 低 于 2 000 000 000 〈 如 果 你 需要 双 小 数 点 值 则 为 
20 000 000) 。 双 精度 浮 点 数 允 许 存 储 上 十 亿 的 数字 ， 即 便 是 双 小 数 点 值 。 然 而 ， 浮 点 数 的 存 
储 通常 有 四 舍 五 人 的 错误 ， 这 会 影响 会 计 的 工作 ， 因 为 他 们 的 计算 需要 精确 到 美 分 。 要 弥补 
这 些 问 题 ， 数 据 库 系 统 提供 了 一 个 货币 数据 类 型 ， 它 作为 整数 值 ( 带 有 一 个 附加 的 小 数 点 ) 
存储 和 计算 。 它 们 计算 速度 很 快 ， 可 以 存储 大 至 万 亿 的 数值 ， 并 且 将 四 舍 五 人 的 错误 最 小 化 。 
有 些 系统 提供 一 个 通用 的 定点 数据 类 型 。 例 如 ， 可 以 指定 你 需要 4 位 十 进 制 数字 精度 ， 然 后 ， 
数据 库 在 存储 数据 和 执行 计算 时 将 使 用 4 位 十 进 制 数字 。 


2.7.3 日 期 和 时 间 


所 有 数据 库 都 需要 一 个 特别 的 数据 类 型 来 存储 日 期 和 时 间 。 大 部 分 系统 将 这 两 者 合 为 一 个 
域 ， 有 些 则 提供 两 种 单独 的 定义 。 很 多 初学 者 试图 将 日 期 存 成 字符 串 或 数值 。 请 避免 这 种 尝 
试 。 日 期 类 型 具有 重要 的 特性 。 日 期 (和 时 间 ) 实际 上 存储 为 单独 的 数字 。 日 期 一 般 存储 为 
整数 ， 是 距 某 个 起 始 日 期 的 天 数 的 计数 。 这 个 起 始 日 期 可 能 随 系 统 不 同 而 不 同 ， 但 它 只 在 内 
部 使 用 。 以 计数 方式 存储 日 期 的 价值 在 于 系统 能 够 自动 执行 日 期 计算 。 你 能 够 很 方便 地 计算 
两 个 日 期 之 间 的 天 数 ， 也 可 以 要 求 系统 计算 今天 往 后 30 天 的 日 期 。 即 使 那 一 天 处 在 不 同 的 月 
份 或 年 份 之 中 ， 系 统 也 可 以 自动 计算 出 正确 的 日 期 。 尽 管 大 部 分 系统 需要 8 字 节 来 存储 日 期 /时 
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间 列 ， 这 样 做 不 需要 关心 任何 年 份 转换 问题 。 

使 用 内 部 日 期 和 时 间 表 示 方 法 的 第 二 个 重要 原因 在 于 ， 数 据 库 系统 能 在 内 部 格式 和 任何 通 
用 格式 之 间 进行 转化 。 例 如 ， 在 欧洲 国家 ， 日 期 一 般 以 日 /月 /年 的 格式 显示 ， 而 不 是 美国 通用 
的 月 /日 /年 格式 。 使 用 通用 的 内 部 表示 方法 ， 用 户 可 选择 他 们 喜欢 的 输入 或 查看 日 期 的 方法 。 
DBMS 自 动 将 其 转化 为 内 部 格式 ， 因 此 内 部 日 期 总 是 一 致 的 。 

数据 库 还 需要 存储 时 间 间 隔 的 能 力 。 通 用 的 范例 是 用 一 列 存储 年 、 月 、 日 、 分 钟 甚至 秒 。 
例如 ， 你 可 能 要 存储 雇员 完成 一 个 任务 所 需 的 时 间 长 度 。 如 果 没 有 特定 的 时 间 间 隔 数 据 类 型 ， 
你 会 将 它 存储 为 数值 。 然 而 ， 你 必须 记录 这 个 数值 的 含义 一 它 可 能 是 小 时 ， 分 钟 或 秒 。 使 用 
一 个 特定 的 时 间 间 隔 类 型 ， 混 淆 的 几率 会 降低 。 


2.7.4 ”二进制 对 象 


将 对 象 或 二 进 制 大 对 象 (BLOB ) 作为 一 个 单独 的 类 是 一 个 相对 新 的 领域 。 它 使 你 能 够 存 
储 任何 计算 机 创造 的 对 象 类 型 。 一 个 实例 是 使 用 BLOB 存 储 其 他 软件 包 中 的 图 片 和 文件 。 例 如 ， 
数据 库 中 的 每 行 可 以 存储 不 同 的 电子 数据 表 、 图 片 或 图 表 。 工 程 数据 库 可 以 存储 不 同 组 件 的 
图 片 和 说 明 书 。 其 优势 是 所 有 数据 存储 在 一 起 ， 使 用 户 更 容易 查找 他 们 需要 的 信息 并 简化 备 
份 。 相 似 地 ， 数 据 库 可 以 存储 一 个 电子 数据 表 的 不 同 版 本 ， 以 显示 它 如 何 随时 间 而 变化 或 记 
录 不 同 用 户 对 它 的 修改 。 


2.7.5 计算 值 


有 些 业 务 属性 可 以 计算 。 例 如 ， 一 次 销售 的 总 额 可 以 由 单个 商品 的 价格 之 和 加 上 销售 税 来 
计算 。 而 雇员 的 年 龄 可 以 由 今天 的 日 期 与 DateOfBirth 之 差 计算 。 在 设计 阶段 ， 你 应 当 指明 哪 
些 数据 属性 可 以 计算 。UML 的 符号 表示 方法 是 在 属性 名 称 前 加 斜 杠 〈/)， 并 在 注释 中 描述 计 
算 方法 。 例 如 ， 一 个 人 年 龄 的 计算 如 图 2-21 所 示 。 注 释 用 一 个 带 折 角 的 框 显 示 。 用 虚线 与 适当 
的 属性 相连 。 -~ 





图 2-21 派生 值 。 不 必 存 储 Age 属 性 ， 因 为 它 可 以 从 出 生日 期 计算 得 到 。 因 此 ， 
需要 在 类 图 中 标注 。 计 算 的 属性 名 称 由 斜 杠 开始 


2.7.6 自 定 义 类 型 ( 域 /对 象 ) 


一 些 较 大 的 数据 库 系统 支持 相对 较 新 的 对 象 -关系 属性 。 你 可 以 定义 自己 的 域 为 现 有 类 型 
的 结合 。 这 个 域 本 质 上 成 为 一 个 新 的 对 象 类 型 。 最 容易 明白 的 例子 之 一 是 经 纬度 代码 。 你 可 
以 用 纬度 和 经 度 的 方式 定义 一 个 地 理 位 置 。 如 果 有 可 能 ， 加 入 海拔 高 度 。 在 简单 的 关系 DBMS 
中 ， 这 个 数据 以 不 同 的 列 存储 。 当 你 想 使 用 这 个 数据 时 ， 必 须 向 你 的 代码 查找 并 传递 所 有 的 
值 。 有 了 自 定义 数据 类 型 ， 你 可 以 创建 一 个 叫做 位 置 的 新 数据 类 型 ， 它 包括 需要 的 组 成 部 分 。 
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这 样 ， 你 的 列 定义 只 有 一 个 单独 的 数据 类 型 (位 置 ) ， 但 它 实际 上 存储 着 两 个 或 三 个 数据 。 
DBMS 把 这 些 元 素 作为 一 个 单独 的 条 目 对 待 。 注 意 ， 当 你 创建 一 个 新 域 时 ， 你 还 必须 创建 用 于 
比较 域 值 大 小 的 函数 ， 这 样 你 才能 排序 和 查找 新 的 数据 类 型 。 


2.8 事件 


事件 是 现代 数据 库 系统 中 需要 了 解 的 另 一 个 重要 的 组 成 部 分 。 数 据 库 环境 会 产生 三 类 基本 
的 事件 : 

1) 触发 某 些 函数 的 业务 事件 ， 例 如 销售 会 触发 库存 减少 。 

2) 数据 改变 导致 发 出 某 些 警告 ， 例 如 库存 低 于 预先 设 定 的 值 会 触发 新 的 购买 订单 。 

3) 用 户 界面 触发 某 些 操作 ， 例 如 用 户 点 击 图 标 向 供应 商 发 出 购买 订单 。 

事件 是 依赖 于 时 间 的 操作 。UML 提 供 了 许多 图 用 于 描述 事件 。 协 作 图 可 能 是 记录 业务 流 
程 和 事件 最 有 效 的 方法 。 复 杂 的 用 户 界面 事件 可 以 用 序列 图 或 状态 图 来 显示 。 后 两 种 图 超出 
了 本 书 的 范围 。 你 可 以 参考 面向 对 象 设计 课程 来 获取 如 何 描述 它们 的 详细 信息 。 

业务 事件 可 能 相互 关联 ， 因 此 一 个 事件 可 以 触发 另 一 个 事件 ， 等 等 。 对 于 复杂 的 事件 链 ， 
或 许 应 当 绘制 一 个 流程 图 来 显示 期 望 的 事件 序列 。 图 2-22 是 一 张 小 型 协作 图 。 它 显示 了 三 个 类 
如 何 通过 交换 信息 和 调用 不 同类 的 函数 来 相互 作用 。 注 意 ， 由 于 顺序 很 重要 ， 因 此 三 个 主要 
触发 行动 按 顺 序 编号 。 首 先 ， 调 用 Order 类 传送 一 个 订购 ， 这 触发 一 条 消息 给 Inventory 类 ， 以 
减少 适当 的 库存 数量 。 当 库存 数量 改变 时 ， 自 动 触发 器 调用 一 个 例 程 分 析 当 前 的 库存 等 级 。 
如 果 达 到 适当 的 标准 ， 会 产生 一 个 购 货 订单 并 记录 购买 的 产品 。 





图 2-22 合并 模型 。 数 据 对 象 设计 为 易于 存储 。 业 务 流程 (ShipOrder 和 
AnalyzeInventory) 是 引发 数据 对 象 改变 的 事件 。 例 如 ， 运 送 一 个 订单 
引起 库存 的 改变 ， 它 接着 触发 对 于 当前 库存 级 别 的 分 析 ， 它 能 触发 新 
的 库存 订货 
这 个 例子 描述 了 一 个 事件 链 ， 它 相对 容易 理解 和 测试 。 更 复杂 的 链 可 以 自身 循环 并 包含 更 
复杂 的 选项 。UML 序 列 图 可 用 于 更 详细 地 显示 单个 消息 是 如 何 按 适当 顺序 处 理 的 。UMI 状 态 
图 突出 类 /对 象 的 状态 随时 间 的 变化 情况 。 事 件 在 构建 系统 中 是 很 重要 的 ， 它 能 够 包含 复杂 的 
交互 。 现 在 ， 你 应 该 能 够 绘制 简单 的 协作 图 指示 主要 的 消息 事件 。 
简单 的 情况 下 ， 可 以 保存 一 个 重要 事件 列表 ， 将 重要 事件 定义 为 触发 器 ， 它 描述 事件 的 起 
源 和 采取 的 相应 操作 。 例 如 ， 基 于 库存 数据 的 业务 事件 可 以 描述 成 图 2-23 所 示 。 像 Oracle 和 
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SQL Server 这 样 的 大 型 数据 库 系统 直接 支持 触发 器 。 你 可 以 定义 事件 并 附加 上 当 条 件 满足 时 将 
要 执行 的 代码 。 

在 设计 阶段 ， 这 些 触发 器 可 以 描述 成 任何 基本 形式 〈 例 如 伪 代 码 ) ， 随 后 转 成 数据 库 触 发 
器 或 程序 代码 。 统 一 建 模 语言 还 提供 了 一 种 对 象 约束 语言 (OCL) ， 可 以 用 来 编写 触发 器 和 其 
他 代码 段 。 如 果 使 用 一 种 能 将 OCL 代 码 转 入 所 使 用 的 数据 库 工具 ， 将 会 十 分 通用 和 有 效 。 


ON (QuantityOnHand < 100) 
THEN Notify purchasing Manager 


图 2-23 示例 触发 器 。 列 出 条 件 和 操作 


2.9 大 型 项 目 


如 果 为 自己 或 单独 的 用 户 建立 一 个 小 型 数据 库 ， 可 能 不 会 花 时 间 为 整个 系统 绘图 。 然 而 ， 
你 确实 应 当 提 供 一 些 文档 ， 这 样 ， 当 其 他 设计 者 修改 你 的 工作 的 时 候 ， 知 道 你 做 了 些 什么 。 
另 一 方面 ， 如 果 你 正在 开发 一 个 大 型 项 目 ， 包 括 很 多 开发 者 和 用 户 ， 那 么 每 人 都 必须 遵守 一 
个 公共 的 设计 方法 。 何 谓 大 型 项 目 ， 何 谓 小 型 项 目 ? 这 里 没有 固定 规则 ， 但 当 项 目 包括 若 干 
开发 人 员 和 许多 用 户 时 ， 你 会 遇 到 图 2-24 中 列 出 的 问题 。 
大 型 项 目的 方法 论 起 始 于 绘图 ， 就 像 本 章 描 述 





的 类 图 和 协作 图 。 然 后 , 每 个 公司 或 团队 添加 细 地 。 mm 
例如 ， 选 择 标准 来 指定 命名 规范 ， 需 要 的 文档 类 型 “IT 工作 者 之 间 的 交流 
和 检查 流程 。 * 需要 为 团队 将 项 目 分 块 
> * 查找 数据 组 件 

大 型 项 目的 挑战 在 于 将 项 目 分 割 成 可 由 单个 开 .人 员 周 转 一 再 培训 
发 人 员 处 理 的 小 模块 。 而 且 这 些小 模块 在 最 后 必须 需要 监督 设计 过 程 
合成 一 体 。 项 目 经 理 还 需要 根据 时 间 和 费用 计划 项 a 
目 。 开 发 项 目 时 ， 管 理 者 能 够 根据 进度 评估 团队 成 建立 以 后 可 修改 的 系统 
员 。 Dd 





很 多 类 型 的 工具 能 帮 你 设计 数据 库 系 统 ， 而 且 "交流 /基本 假设 和 模型 
都 特别 适用 于 大 型 项 目 。 要 辅助 设计 和 监控 进度 ，。 图 2.24 开发 大 型 项 目的 问题 。 大 型 项 
管理 者 可 以 使 用 项 目 计划 工具 〈 例 如 Microsoft 目 更 需要 进行 交流 、 坚 持 标准 
Project) ， 帮 助 建立 Gantt 和 PERT 图 ， 将 项 目 分 成 小 以 及 监督 项 目 
块 ， 并 突出 各 部 分 之 间 的 关系 。 计 算 机 辅助 软件 工程 (CASE) 工具 (例如 Rational Rose) 可 
以 帮助 团队 绘图 ， 贯 彻 标 准 和 存储 所 有 项 目 文档 。 此 外 ， 群 件 工 具 (例如 Lotus Notes/Domino) 
帮助 团队 成 员 以 文档 、 设 计 和 程序 方式 共享 他 们 的 工作 。 这 些 工具 标记 变化 ， 记 录 作 出 修改 
的 人 和 他 们 的 意见 ， 并 跟踪 版 本 。 

就 像 图 2-25 中 总 结 的 那样 ，CASE 工 具 可 以 为 开发 者 提供 很 多 有 用 的 功能 。 除 了 辅助 绘 
以 外 ，CASE 工 具 最 重要 的 功能 之 一 是 维护 项 目的 数据 仓库 。 开 发 者 定义 的 每 个 元 素 都 存储 在 
数据 仓库 中 ， 数 据 在 此 可 以 与 其 他 开发 者 共享 。 换 名 话说 ， 数 据 仓库 是 一 个 特殊 的 数据 库 ， 
它 保存 所 有 与 项 目 设计 相关 的 信息 。 有 些 CASE 工 具 依据 你 提供 给 CASE 项 目的 信息 ， 能 够 生 
成 数据 库 和 应 用 。 逆 向 工程 工具 能 从 现 有 的 应 用 中 读 取 文件 ， 生 成 对 应 的 设计 元 素 。 很 多 公 
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司 提供 CASE 工 具 ， 包 括 Rational Software、IBM.、 Oracle 和 Sterling Software。 通 过 增进 开发 者 


之 间 的 交流 和 生成 代码 ，CASE 工 具 能 够 加 速 设计 
和 开发 过 程 。 通 过 提供 系统 的 完备 文档 ， 它 们 还 具 
有 缩短 维护 时 间 的 潜力 。 

优秀 的 CASE 工 具 已 经 有 若干 年 的 历史 ， 但 仍 
有 很 多 公司 不 使 用 它们 ， 一 些 公司 虽然 使 用 ， 但 是 
没 能 体会 到 潜在 的 优势 。CASE 工 具 的 两 个 缺陷 是 
其 复杂 性 和 成 本 。 如 果 对 于 一 个 已 知 项 目 ， 这 个 工 
具 能 减少 开发 者 的 人 数 ， 就 可 以 降低 成 本 。 但 其 复 
杂 性 问题 是 很 大 的 障碍 。 学 会 有 效 使 用 一 种 CASE 
工具 可 能 要 花费 一 个 开发 者 几 个 月 的 时 间 。 幸 运 的 
是 ， 有 些 CASE 厂 商 提供 折扣 给 大 学 ， 帮 助 培训 学 
生 使 用 他 们 的 工具 。 如 果 你 有 机 会 接触 CASE 工 具 ， 
应 尽 可 能 多 地 在 任务 中 使 用 它 。 


2.10 ”Rolling Thunder 自 行车 


计算 机 辅助 软件 工程 (CASE) 
“图 (连接 的 ) 
“数据 字典 
“协同 工作 
。 原 型 


“表单 

“ 报表 

“示例 数据 
* 代码 生 成 
“逆向 工程 





图 2-25 CASE 工 具 的 功能 。CASE 工 具 辅助 
建立 和 维护 图 ， 还 支持 团队 工作 和 
文档 控制 。 有 些 可 以 从 设计 生成 代 
码 。 其 他 可 以 检查 应 用 并 通过 逆向 
工程 创建 相应 的 代码 


Rolling Thunder 自 行车 案例 阐明 了 一 些 业务 环境 中 出 现 的 通用 关联 。 因为 这 个 应 用 是 为 课 
程 设计 的 ， 所 以 很 多 业务 有 意 简化 了 。 最 高 层 的 视图 如 图 2-26 所 示 。 图 中 列 出 了 看 似 松散 的 几 
个 公司 行为 ， 分 为 六 个 包 : Sale、Bicycles、Assembly、Employees、 Purchasing 和 Location。 
包 并 不 相等 : 有些 包 的 信息 细节 远 多 于 其 他 包 。 特 别 是 ， Location 和 Employee 包 目前 只 含有 一 
到 两 个 类 ， 被 当 作 单独 的 包 对 待 ， 因 为 它们 都 与 多 个 包 中 的 若干 类 交互 。 由 于 它们 要 处 理 独 


立 、 自 包含 的 问题 ， 所 以 分 离 它们 才 有 意义 。 





图 2-26 Rolling Thunder 自行 车 一 一 顶层 视图 。 这 些 包 松散 地 基于 公司 的 活动 。 
每 个 包 的 目标 是 描述 一 个 独立 的 对 象 集合 ， 它 与 其 他 包 相互 作用 


每 个 包 包括 类 和 关联 的 集合 。Sales 包 在 图 2-27 中 更 详细 地 描述 。 为 了 最 小 化 复杂 性 ， 与 
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其 他 包 之 间 的 关联 在 此 图 中 没有 显示 。 例 如 ，Customer 和 RetailStore 类 与 Location::City 类 具有 
关联 。 这 些 关 系 将 会 在 Location 包 中 显示 。 因 此 ，S$ales 包 是 很 直接 的 。Customers 提 交 订 单 订 
购 Bicycles。 他 们 可 以 使 用 RetailStore 来 帮助 提交 订单 ， 但 也 不 必 这 样 做 。 这 样 ， 关 联 的 
RetailStore 端 有 (0...1) 复杂 度 。 






图 2-27 Rolling Thunder 自行 车 一 一 Sales 包 。 与 其 他 包 的 一 些 关 联 没有 显示 在 
这 里 (参考 其 他 包 ) 


Bicycle 包 具有 使 这 个 公司 独特 的 许多 细节 。 为 了 节省 空间 ， 图 2-28 中 仅 显示 了 Bicycle 类 
的 一 部 分 属性 。 注 意 ， 自 行车 由 管子 集合 与 零 部 件 集合 组 成 。 用 户 可 以 选择 用 于 制造 自行 车 
的 材料 种 类 〈 铝 、 钢 、 碳 化 纤维 等 等 ) 。 他 们 还 可 以 选取 自行 车 的 零 部 件 (车 轮 、 曲 柄 、 踏 板 
等 等 )。 这 两 类 都 与 Bicycle 类 具有 组 合 关联 。Bicycle 类 是 这 家 公司 最 重要 的 类 之 一 。 它 与 


图 2-28 Rolling Thunder 自行 车 一 一 Bicycle 包 。 注 意 从 BikeTubes 类 和 BikeParts 
类 到 Bicycle 类 的 组 合 关联 。 为 了 节省 空间 ， 只 显示 了 Bicycle 的 部 分 属性 
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BicycleTubeUsed 和 BikeParts 类 一 起 完全 定义 了 每 辆 自行 车 。Bicycle 类 还 包含 制造 了 这 辆 自行 
车 的 雇员 信息 。 这 种 决定 是 简化 设计 的 选择 。 另 一 种 选择 是 将 ShipEmployee，FrameAssembler 
和 其 他 雇员 属性 转移 到 Assembly 包 中 的 一 个 新 类 中 。 

如 图 2-29 所 示 , Assembly 包 包含 有 关 组 成 自行 车 的 各 种 零 部 件 和 管子 的 详细 信息 。 实 际 上 ， 
Assembly 类 还 包含 一 些 重要 的 事件 。 当 自行 车 装配 完成 后 ， 数 据 加 入 以 指明 完成 这 项 任务 的 
雇员 以 及 完成 任务 的 时 间 。 这 个 数据 现在 存储 在 Bicycle 包 中 的 Bicycle 类 中 。 需 要 创建 协作 图 
或 序列 图 来 显示 Assembly 包 中 各 种 事件 的 详细 信息 。 对 于 目前 来 说 ， 类 和 关联 更 为 重要 ， 因 
此 这 里 没有 显示 其 他 图 。 





图 2-29 Rolling Thunder 自行 车 一 Assembly 包 。 装 配 过 程 中 会 产生 若干 事件 ， 
但 没有 显示 在 这 张 图 上 。 当 装配 自行 车 时 ， 附 加 数据 输入 到 Bicycle 包 
的 Bicycle 表 中 
所 有 的 零 部 件 需要 从 其 他 制造 商 ( 供 应 商 ) 那里 购买 。 图 2-30 所 示 的 Purchase 包 是 这 个 行 
动 相当 传统 的 一 种 表现 形式 。 注 意 ， 每 次 购买 需要 使 用 两 个 类 : PurchaseOrder 和 PurchaseItem 
类 。PurchaseOrder 类 是 主 类 ， 包 含 订购 本 身 的 数据 ， 包 括 日 期 、 制 造 商 和 提交 订单 的 雇员 。 
PurchaseItem 类 包含 订购 物品 的 详细 列表 。 包 含 这 个 专门 的 类 ， 为 了 避免 PurchaseOrder 和 
Component 类 之 间 的 多 对 多 关联 。 
注意 ， 根 据 业 务 规则 ，PurchaseOrder 类 必须 包含 一 个 ManufacturerID 字 段 。 不 了 解 制造 商 
的 身份 就 提交 购买 订单 是 非常 危险 的 。 第 10 章 将 介绍 如 何 利 用 安全 控制 为 这 方面 业务 提供 更 
安全 的 保障 。 
一 个 附加 类 (ManfacturerTransactions) 用 作 交 易 日 志 记录 每 笔 购 货 信 息 。 它 还 用 于 记录 
付 给 制造 商 的 货款 。 在 购买 这 一 方 ， 表 现 出 微小 的 数据 重复 (AmountDue 在 PurchaseOrder 和 
Transaction 类 中 都 存在 ) 。 然 而 ， 这 是 建立 会 计 系统 相对 通用 的 方法 。 传 统 的 会 计 方法 依赖 于 
将 所 有 相关 的 交易 数据 存储 在 一 个 地 方 。 无 论 如 何 都 需要 记录 对 制造 商 的 付款 ， 因 此 数据 重 
复 是 相对 次 要 的 。 
图 2-31 中 的 Location 包 用 于 集中 城市 和 地 址 相关 的 数据 。 很 多 类 具有 地 址 属性 。 在 较 老 的 
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图 2-30 Rolling Thunder 自行 车 一 一 Purchasing 包 。 注 意 使 用 Transaction 类 在 同 
一 位 置 为 制造 商 存 储 所 有 相关 的 金融 数据 


系统 中 ， 很 容易 将 城市 、 州 和 邮编 数据 复制 并 存储 到 每 个 涉及 地 点 的 类 中 。 然 而 现在 ， 获 取 
关于 城市 的 有 用 信息 并 将 其 存储 在 一 个 集中 的 表 中 是 相对 简单 的 。 这 种 方法 在 速度 和 数据 完 
整 性 方面 简化 了 数据 条 目 。 职 员 可 简单 地 从 列表 中 选取 一 个 地 点 。 数 据 的 输入 总 能 保持 一 致 。 
例如 ， 你 不 必 担 心 城市 的 缩写 。 如 果 电 话 区 号 或 邮政 编码 发 生 改变 ， 你 只 需 在 一 张 表 中 修改 
它们 。 你 还 能 存储 对 于 管理 者 有 用 的 额外 信息 。 例 如 ， 人 口 和 地 理 位 置信 息 可 用 于 分 析 销 售 
数据 并 指导 销售 计划 。 





图 2-31 Rolling Thunder 自行 车 一 一 Location 包 。 通过 将 与 城市 相关 的 数据 集中 ， 
你 能 够 提高 职员 的 办 公 效 率 和 数据 的 质量 ， 还 可 以 存储 对 经 理 有 用 的 
关于 地 点 的 额外 信息 


Employee 包 要 单独 对 待 ， 因 为 它 与 其 他 很 多 包 相互 作用 。 图 2-32 所 示 的 Employee 类 属性 
非常 简单 易 懂 。 注 意 表 示 管理 关系 的 自 反 关联 。 当 前 Employee 包 中 只 有 一 个 类 。 实 际 上 这 是 
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你 存放 人 力 资 源 数据 和 关联 的 地 方 ， 例 如 ， 你 可 能 希望 随时 追踪 雇员 评估 、 任 务 和 晋升 情况 。 
附加 类 一 般 会 与 利益 有 关 ， 例 如 休假 时 间 、 私 人 时 间 和 保险 选项 。 






manages > 


© 
。 
sh 


| manager 


图 2-32 Rolling Thunder 自行 车 一 Employee 包 。 注 意 使 用 自 反 关联 来 表示 经 理 


图 2-33 显 示 了 Rolling Thunder 自 行车 企业 的 详细 、 综 合 的 类 图 。 有 些 关 联 不 包含 在 图 
中 一 一 部 分 原因 是 为 了 节省 空间 。 更 重要 的 原因 是 图 中 所 有 关联 都 是 Microsoft Access 绘 制 的 。 





图 2-33 Rolling Thunder 详 细 的 类 图 。Microsoft Access 与 UML 稍 有 不 同 。 例 如 ，Access 用 
无 穷 大 符号 (% ) 代替 星 号 (*) 来 表示 多 的 关系 。 类 图 是 了 解 企业 的 不 错 的 参考 
工具 ， 但 对 于 很 多 公司 ， 这 种 详细 程度 的 类 图 会 很 大 ， 以 至 于 不 能 显示 
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例如 ， 当 你 定义 一 个 从 Employee 到 Bicycle 的 关联 时 ，Access 将 只 允许 你 向 Bicycle 类 中 加 入 一 
个 Employee 类 中 存在 的 EmployeeID 字 段 。 这 种 执行 方式 对 于 处 理 这 项 任务 的 人 来 说 是 有 意义 
的 。 事 实 上 ， 金 融 关 联 应 当 这 样 严格 地 定义 。 另 一 方面 ， 公 司 可 能 会 雇佣 临时 工人 来 喷漆 和 
设计 装配 。 在 这 种 情况 下 ， 管 理 者 可 能 不 希望 记录 这 些 额 外 的 人 员 ， 因 此 从 Employee 到 
Bicycle 表 中 Painter 的 关联 是 不 严格 的 。 


2.11 应 用 设计 


类 和 属性 的 概念 似乎 很 简单 ， 但 是 很 快 就 变 得 非常 复杂 。 练 习 和 实践 能 使 这 个 过 程 容易 一 
些 。 目 前 ， 先 学 会 把 精力 集中 在 项 目 中 最 重要 的 对 象 上 。 一 般 来 说 ， 从 问题 的 某 一 部 分 开始 
是 最 容易 的 ， 先 定义 基本 元 素 ， 添 加 细节 ， 然 后 扩展 到 其 他 部 分 。 当 你 设计 项 目 时 ， 请 记 住 ， 
每 个 类 都 会 变 成 数据 库 中 的 一 张 表 ， 类 中 的 每 个 属性 是 一 列 ， 每 一 行 表 示 某 一 特定 对 象 。 

你 还 应 当 根据 用 户 可 见 的 表单 或 界面 来 考虑 应 用 设计 。 考虑 图 2-34 中 的 简单 表单 。 在 纸 上 ， 
表单 中 需要 输入 的 每 项 数据 会 简单 地 显示 为 空白 。 最 终 ， 你 可 以 建立 一 个 相同 的 带 空白 的 表 
单 作 为 数据 库 表单 。 在 此 例 中 ， 你 可 能 考虑 到 只 
有 一 张 表 与 这 个 表单 相关 联 ， 然 而 ， 你 需要 思考 
琉 在 的 问题 。 在 表单 中 的 空白 处 ， 人 们 可 以 输入 
任何 想 要 输入 的 数据 。 例 如 ， 用 户 真正 了 解 所 有 
的 种 属 类 别 吗 ? 或 者 他 们 会 不 会 经 常 空 着 它 、 填 
写 缩写 或 拼 错 单词 ? 所 有 这 些 情况 都 会 给 你 的 数 
据 库 带 来 问题 。 因 此 ， 为 他 们 提供 一 个 选择 框 会 
更 好 一 些 ， 用 户 只 需 简单 地 从 列表 中 选取 合适 的 


项 。 但 那 意 味 着 你 需要 另 一 张 表 来 存储 可 能 的 种 图 2.34 基本 的 Animal 表 单 ， 开 始 时 这 张 表单 





属 类 别 。 还 意味 着 你 需要 在 Breed 表 和 Animal 表 之 似乎 只 需要 一 张 表 (Animal)。 但是， 

间 建 立 关 系 。 这 个 关系 会 影响 应 用 的 实用 方式 。 为 了 将 数据 输入 错误 减 至 最 小 ， 实 际 

例如 ， 某 人 必须 先 将 所 有 预先 定义 的 名 称 输入 到 上 需要 一 张 表 来 存储 Category 和 Breed 
; 的 数据 ， 在 表单 上 这 些 数据 可 以 通过 

Breed ， 然 后 Animal 。 

reed 表 中 ， 然 后 Animal 表 才能 使 用 它 一 个 选择 框 进 行 输入 


在 开发 中 的 这 一 点 上 ， 你 应 当 与 用 户 交流 并 收 
集 他 们 想 要 的 任何 表单 和 报表 。 你 应 当 能 够 绘制 一 个 初始 类 图 ， 展 示 主 要 的 业务 对 象 和 相互 
关联 一 一 包括 关联 的 重复 度 。 你 还 应 当 把 哪些 属性 当 作 主 码 ， 用 哪些 主 码 来 建立 表 作 为 设计 的 
重点 。 同 时 ， 还 需要 指定 每 个 属性 的 数据 域 。 


小 结 


管理 项 目 以 建立 有 效 的 应 用 和 控制 成 本 是 一 项 重要 的 任务 。 项 目 管理 的 主要 步骤 是 可 行 性 
研究 、 系 统 分 析 、 系 统 设计 和 实现 。 尽 管 这 些 步骤 可 以 被 压缩 ， 但 是 不 能 被 跳 过 。 

主要 的 目标 是 设计 一 个 能 给 用 户 提供 所 需 利益 的 应 用 。 建 立 系统 模型 来 描述 系统 。 这 些 模 
型 可 用 于 与 用 户 交流 ， 与 其 他 开发 者 交流 ， 并 帮助 我 们 记 住 系统 的 细节 。 因 为 在 开发 数据 库 
应 用 中 ， 定 义 数据 是 至 关 重 要 的 一 步 ， 因 此 ， 类 图 是 很 流行 的 模型 。 

通过 确认 系统 中 的 主要 实体 来 创建 类 图 。 实 体 由 类 来 定义 ， 类 由 名 称 标 识 并 由 每 个 实体 的 
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属性 定义 。 类 还 拥有 可 执行 的 函数 。 

类 之 间 的 关联 是 业务 设计 的 重要 元 素 ， 因 为 它们 确定 了 业务 规则 。 关 联 在 类 图 中 显示 为 连 
接 的 线段 。 你 应 当 在 适当 的 地 方 用 名 称 和 关系 的 重复 度 标识 关联 。 你 应 当 小 心地 确认 特殊 的 
关联 ， 例 如 聚集 、 组 合 、 概 括 和 自 反 关联 。 

设计 者 还 需要 确定 应 用 需要 的 主要 事件 或 触发 器 。 有 三 种 类 型 的 事件 : 业务 事件 、 数 据 改 
变 事件 和 用 户 事 件 。 事 件 可 以 用 包含 条 件 和 操作 的 触发 器 来 描述 。 复 杂 的 事件 串 可 以 用 顺序 
图 或 状态 图 来 表示 。 

设计 通常 要 经 过 若干 阶段 的 修正 ， 每 个 阶段 都 更 加 详细 和 精确 。 一 种 有 效 的 途径 是 从 一 张 
大 的 蓝图 开始 ， 确 保 你 的 设计 符合 系统 所 需 的 主要 部 分 。 包 的 定义 可 以 为 元 素 分 组 以 隐藏 细 
节 。 随 后 细节 被 添加 到 系统 类 图 中 的 每 个 包 的 支持 图 里 。 

模型 和 设计 对 于 大 型 项 目 尤 其 有 用 。 模 型 为 设计 者 、 程 序 员 和 用 户 提 供 了 沟通 的 机 制 。 
CASE 工 具有 助 于 创建 、 修 改 和 共享 设计 模型 。 除 类 图 以 外 ，CASE 的 存储 器 将 维护 建立 最 终 
应 用 所 需 的 所 有 定义 、 描 述 和 注释 。 





关键 
聚集 (运算 ) 数据 规范 化 多 态 性 
关联 数据 类 型 主 码 
关联 角色 派生 类 属性 
封装 快速 应 用 开发 二 进 制 大 对 象 (BLOB) 
实体 概括 自 反 关联 
类 继承 关系 数据 库 
类 图 ; 方法 关系 
类 层次 重复 度 表 
协作 图 多 重 关联 统一 建 模 语言 
组 合 空 值 
复习 是 


1. 业务 规则 在 类 图 中 是 如 何 表 示 的 ? 

2. 类 图 (或 实体 关系 图 ) 的 作用 是 什么 ? 
3. 什么 是 自 反 关联 ， 它 在 类 图 中 如 何 表 示 ? 
4. 什么 是 主 码 ? 

5. 什么 是 重复 度 ， 它 在 类 图 中 如 何 表示 ? 
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6. 商业 应 用 中 用 到 的 主要 数据 类 型 有 哪些 ? 

7. 继承 在 实体 关系 图 中 是 如 何 表示 的 ? 

8. 事件 和 触发 器 是 如 何 与 对 象 或 实体 相关 联 的 ? 

9. 大 型 项 目 中 的 复杂 问题 有 哪些 ? 

10. 计算 机 辅助 软件 工程 工具 在 大 型 项 目 中 如 何 应 用 ? 


练习 


1. 一 家 小 型 游艇 租赁 公司 需要 一 个 数据 库 来 记录 关于 租赁 和 游艇 的 基本 信息 。 最 后 ， 公 司 希 
望 能 够 确定 给 游艇 造成 损坏 的 客户 ， 但 目前 ， 经 理 只 希望 记录 成 本 。 经 理 已 经 以 表单 的 形 
式 描述 了 数据 。 为 此 例 创建 一 个 类 图 。 


Rental ID Canoe Rental Rent Date 


Customer Credit Card Number 
Last Name, First Name Expiration Date 
Email Phone Name on Card 
Address Deposit Amount 
City, State PostalCode 


Description: Returned Damage Total 
Length, Date Charge 
Material 





2. 一 家 小 型 的 完 物 饲养 公司 需要 一 个 数据 库 来 记录 其 雇员 所 做 的 工作 。 目 前 ， 公 司 使 用 与 这 
里 所 示 的 表单 相似 的 纸 质 表格 。 对 于 每 个 时 间 空 档 ， 雇 员 记录 关于 客户 、 完 物 和 完成 任务 
的 信息 。 所 有 任务 都 有 一 个 基本 费用 ， 但 雇员 依据 任务 的 难度 和 宠物 的 不 同 可 以 对 数额 进 
行 修改 。 公 司 希 望 雇员 记录 有 关 宠 物 和 特定 任务 的 往 释 。 为 此 例 创 建 一 个 类 图 。 


Empioyee Daily Grooming Record 
Last Name 

first Name Date 

DateHired 

Specialty 


Start Time 


Owner Name, Phone, Address 
Pet Name, Category, Gender 
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3. 一 位 牙医 经 营 一 家 小 公司 ， 包 括 他 自己 、 三 个 卫生 学 者 和 一 位 接待 员 ， 他 需要 一 个 数据 库 记 
录 预 约 计 划 。 他 拥有 一 个 商业 记 账 系统 来 处 理 付款 和 保险 ， 但 预约 目前 是 记录 在 与 这 里 所 示 
类 似 的 纸 质 表单 上 的 。 目 前 表单 只 记录 患者 姓名 和 要 执行 的 主要 程序 (清洗 、X 光 、 补 牙 等 等 )。 
他 希望 添加 更 多 的 信息 ， 列 出 所 有 计划 好 的 程序 ， 佑 算 每 项 程序 的 费用 ， 并 评估 保险 责任 范 
围 。 基 本 费用 应 该 与 程序 存储 在 一 起 ， 但 保险 金额 是 高 度 可 变 的 ， 它 将 由 接待 员 根 据 记 账 系 
统 的 估算 进行 输入 。 系 统 还 需要 记录 患者 的 电话 号 码 和 电子 邮件 地 址 ， 并 记录 他 或 她 希望 以 
何 种 方式 被 通知 。 最 后 ， 它 能 够 向 患者 发 送 电子 邮件 消息 作为 提醒 。 为 此 例 创建 一 个 类 图 。 


Hygienist: Hygienist: Hygienist: 
Dentist Mary Susan David 
Patient Name Patient Name 
Procedure Procedure 


加 

4. 一 家 老字号 制 鞋 公司 因为 市 场 竞 争 激烈 ， 决 定 放 弃 生 产 低 成 本 大 市 场 的 鞋子 。 它 希望 客户 
根据 自己 的 要 求 定制 鞋 子 。 客 户 描述 或 测量 他 们 的 脚 ， 然 后 公司 可 以 为 该 客户 建立 特定 的 
模型 。 客 户 脚 的 信息 将 被 数字 化 并 存储 在 数据 库 中 ， 以 便当 用 户 订 购 鞋 子 的 时 候 可 以 获取 
使 用 。 公 司 将 会 生产 多 种 标准 样式 的 鞋子 。 客 户 可 以 选择 一 种 样式 、 选 取 一 种 颜色 和 尺寸 ， 
并 选择 一 种 材料 。 订 单 被 送 往 公司 的 生产 厂 ， 为 每 个 人 定制 鞋子 。 对 大 多 数 鞋 ， 客 户 还 可 
以 指定 轻微 的 调整 一 例如 因为 某 种 原因 要 求 稍 微 宽松 一 些 的 鞋子 。 基 本 信息 依据 示例 表 
单 输入 ， 但 公司 需要 在 数据 库 中 存储 所 有 的 信息 。 为 此 例 创建 一 个 规范 化 的 表格 。 


OrderiD Order Date 
Estimated Ship Date Actual Ship Date Shipping Cost 


Patient Name 
Procedure 











Customer 

Last Name, First Name, Phone, Email 
Address, City, State, PostatCode 
Country 


LeftFootiD, RightFoodiD, Comments 


Shipping Address 
City, State, PostalCode 
Country 


StylelD Description Color Material Size Adjustments 








5. 


6. 


~ 


oo 
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实践 练习 ， 与 本 地 一 家 商店 的 经 理 交 流 ， 为 商店 的 系统 创建 一 张 类 图 。 
指出 下 列 实体 之 间 的 典型 关系 。 写 下 任何 影响 你 决定 的 假设 和 注释 。 确 保 包 含 最 小 值 和 最 
大 值 。 

a. 书店 ， 书 

b. 货车 ， 司 机 

c. 计算 机 ，IP 地 址 

d. 患者 ， 药 瓶 

e. 房屋， 厨房 

f. 游艇 ， 水 视 

g. 游艇， 码头 

h, 银行 ， 联 邦 储备 区 

i 公司， 主管 

j. 电视 节目 ， 时 间 空 档 

k. 公司 ，NAICS6 位 数字 

1. 检查 账户 号 码 ， 客 户 

mm, 汽车 ， 车 辆 识别 号 码 (VIN) 
n. 捕 鱼 许可 证 ， 渔 场 

0. 驾驶 证 ， 司 机 

p. 飞 机票 ， 乘 客 

d. 处 方 ， 患 者 

r. 经 纬 点 ， 道 路 


. 对 于 下 面 列 表 ( 左 侧 ) 中 的 每 一 个 实体 ， 指 出 右边 的 每 一 项 是 否 应 当 作 为 左 侧 实体 的 属性 


还 是 一 个 独立 的 实体 。 

a. 诗 尺寸 、 销 售 日 期 、 颜 色 、 价 格 、 销 售 员 、 样 式 、 生 产 厂 
b. 汽 车 《模型 、 拥 有 者 、 生 产 厂 、 销 售 人 员 、 引 擎 、 司 机 

c. 工厂 “机 器 、 城 市 、 雇 员 、 经 理 、 所 有 者 、 尺 寸 

d. 监 狱 ” 警卫、 囚犯 、 典 狱 官 、 地 点 、 州 /联邦 、 容 量 

e. 宴 会 地点、 场合 、 嘉 宾 、 菜 单 、 开 始 时 间 、 备 办 宴会 者 、 乐 队 


.你 所 在 大 学 的 广播 站 遇 到 一 个 问题 。 要 广播 歌曲 一 一 尤其 是 以 流 媒体 方式 向 互联 网 广 


播 ， 广 播 站 需要 记录 哪些 歌 播放 过 的 详细 日 志 。 广 播 站 还 希望 了 解 多 少 听众 接收 了 这 
些 歌 。 对 于 互联 网 流 媒 体 来 说 ， 这 个 数字 可 由 流 媒体 软件 显示 。 尽 管 广播 站 想 要 关于 
每 首 歌 的 详细 信息 ， 但 DJ 一 般 更 容易 通过 作者 和 CD 来 点 歌 。 广 播 站 想 要 一 个 易 用 的 数 
据 库 ， 以 便 DJ 迅 速 挑选 歌曲 。 每 次 播放 时 ， 输 入 昕 众 的 数量 ， 以 及 任何 评注 一 -尤其 
因为 某 种 特殊 原因 这 首 歌 没 能 播 完 。 根 据 你 对 音乐 的 了 解 和 示例 日 志 页 ， 为 此 例 创建 
一 个 类 图 。 
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Date Employee 
Time Song Artist CD Studio Comments #Listeners 





9. 一 家 当地 公司 正在 创建 一 种 新 式 车 内 收费 系统 。 客 户 要 购买 一 个 发 射 器 ， 它 是 安装 在 车 内 
的 一 个 小 型 发 射 机 。 他 们 将 向 公司 注册 一 个 信用 卡号 码 。 当 客户 驾车 通过 收费 点 时 ， 发 射 
器 发 出 的 吓 信 号 被 收费 站 接收 。 时 间 和 费用 会 被 记录 ， 客 户 在 月 底 将 收 到 一 个 账单 ， 当 月 
的 总 金额 将 自动 从 信用 卡 中 划 走 。 稍 微 复杂 的 部 分 在 于 每 个 站 点 依据 星期 儿 和 一 天 中 的 不 
同时 间 收 取 不 同 的 费用 。 例 如 ， 高 巍 时 段 的 收费 一 般 比 其 他 时 段 高 。 下 面 的 报表 提供 了 费 
用 结构 和 在 一 个 单独 站 点 需要 采集 的 数据 的 部 分 图 示 。 当 然 ， 会 有 很 多 站 点 ， 客 户 的 数据 
怖 要 累计 从 而 提供 一 个 总 金额 。 为 减少 偷窃 ， 发 射 器 由 特定 汽车 标识 ， 但 当 客 户 售 车 时 可 
以 进行 转移 。 为 此 例 创建 一 个 类 图 。 


Fee Structure 


DayOfWeek Start Time EndTime fee 









Location Description 






Traffic Log 
Date 






Tme EmitterlD Fee 











Sally 的 宠物 商店 

10, 对 零售 和 宠物 商店 做 一 些 初步 的 调研 。 确 定 你 期 望 从 Sally 的 宠物 商店 事务 处 理 系统 中 能 获 
取 的 主要 效益 。 估 算 设 计 和 建立 数据 库 应 用 所 需 的 时 间 和 成 本 。 

11. 通过 添加 记录 所 有 动物 谱系 所 需 的 细节 来 扩充 Sally 的 宠物 商店 的 类 图 。 

12. 通过 添加 记录 动物 健康 状况 和 兽医 记录 所 需 的 细节 来 扩充 Sally 的 宠物 商店 的 类 图 。 

13. 通过 添加 宠物 饲养 计划 来 扩充 Sally 的 宠物 商店 的 类 图 。 
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Rolling Thunder 自 行车 

14. 使 用 面向 对 象 方法 重新 设计 Rolling Thunder 的 类 图 。 确 定 所 有 的 类 、 属 性 和 方法 。 

15. Rolling Thunder 自 行车 公司 在 考虑 开设 连锁 店 。 说 明 数 据 库 应 如 何 修改 以 适应 这 种 变化 。 
向 类 图 中 添加 新 计划 的 组 件 。 

16. 如 果 Rolling Thunder 自 行车 公司 希望 建立 一 个 网 站 来 通过 网 上 销售 自行 车 ， 需 要 收集 什么 
额外 的 数据 ? 扩充 类 图 来 处 理 这 些 额外 的 数据 ， 


参考 网 站 
网 站 描述 
http://www.rational.com/uml/ UML 文 档 和 示例 的 主要 站 点 
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附录 ， 数据库 设计 系统 


很 多 学 生发 现 数据 库 设 计 很 难 学 。 基 本 概念 似乎 很 简单 ， 定 义 一 张 表 代表 一 个 基本 实体 ， 
表 的 列 描述 实体 的 属性 ， 存 储 必需 的 数据 。 例 如 ，Customer 表 将 有 CustomerID、LastName、 
FirstName 等 列 。 但 通常 很 难 决定 一 张 表 具有 哪些 列 。 主 码 列 用 于 建立 表 之 间 的 关系 ， 确 定 主 
码 列 通常 也 是 很 困难 的 。 设 计 的 复杂 性 源 于 表 反 映 了 底层 的 业务 规则 ， 因 此 学 生还 必须 理解 
业务 流程 和 限制 ， 以 便 能 创建 一 个 满足 业务 需求 的 设计 。 

除了 仔细 阅读 第 2 章 和 第 3 章 之 外 ， 学 习 数据 库 设 计 最 重要 的 手段 之 一 在 于 做 尽 可 能 多 的 
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练习 。 而 学 生 也 需要 反馈 他 们 在 设计 中 存在 的 问题 以 改进 设计 。 一 个 面向 教师 和 学 生 的 联机 
专家 系统 可 以 提供 即时 的 反馈 信息 。 这 个 联机 系统 的 网 址 是 : http://time-post.com/dbdesign。 
本 附录 使 用 这 个 DB 设计 系统 来 突出 可 视 化 数据 库 设计 的 优势 。 然 而 ， 即 使 你 不 使 用 这 个 DB 设 
计 系 统 ， 本 附录 仍然 提供 一 种 有 效 进 行 数据 库 设计 的 方法 。 


1 示例 问题 : 客户 订单 


通过 一 个 示例 最 容易 理解 数据 库 设 计 和 DB 设计 系统 。 客 户 订单 在 商业 数据 库 中 很 常见 ， 
考虑 图 2-1A 所 示 的 订单 示例 。 表 单 大 致 提供 了 关于 业务 规则 和 惯例 的 信息 。 例 如 ， 订 单 上 只 
有 填写 一 位 客户 姓名 的 空间 ， 因 此 看 上 去 一 个 订单 只 能 有 一 位 客户 参与 。 相 反 ， 订 单 中 的 多 
行 则 表明 人 允许 一 次 订购 多 项 货物 。 这 些 一 对 多 的 关系 在 数据 库 设计 中 是 很 重要 的 要 素 。 





典型 的 订购 表单 
0rder Form 


Order # 
Customer 


FirstName LastName 
Address 
City, State, ZIP 


rs RT eR EO 
[ti ON SO Np | 


Order Total 





图 2-1A 典型 的 订购 表单 。 每 张 订单 只 能 由 一 位 客户 提交 ， 但 是 可 以 包含 多 个 
订购 项 ， 如 重复 部 分 所 示 


2 开始 : 确定 列 


创建 数据 库 设计 的 初始 步 又 之 一 要 确定 要 收集 数据 的 所 有 属性 或 项 。 在 此 例 中 ， 需 要 存储 
客户 的 姓 、 名 、 地 址 等 等 。 还 需要 存储 一 个 订单 号 、 订 购 日 期 、 项 描述 等 等 。 基 本 上 要 确认 
表单 上 的 每 一 项 并 赋予 一 个 惟一 的 名 称 。 注 意 ， 有 些 项 可 以 很 容易 地 计算 出 来 ， 因 而 不 必 存 
储 。 例 如 ， 值 可 由 价格 乘 以 数量 得 到 ， 订 单 总 额 是 各 值 项 的 总 和 。 

如 图 2-2A 所 示 ， 在 你 打开 一 个 问题 之 后 ，DB 设 计 系统 为 你 提供 了 表单 中 项 的 列表 。 这 个 
列表 显示 在 右边 的 列 中 。 这 些 列 是 数据 库 设计 的 基础 。 你 的 工作 是 创建 表 ， 选 取 属 于 每 个 表 
的 列 。 你 可 以 右 击 列 名 、 选 择 Rename 选 项 来 重 命名 列 。 你 要 确保 名 字 是 惟一 的 。 如 有 果 列 名 相 
同 的 话 ， 系 统 不 会 报错 ， 但 你 在 从 列表 中 选取 列 时 会 出 现 问题 。 要 更 好 地 查看 可 用 的 列 ， 你 
可 以 右 击 列表 并 选择 Sort 选 项 对 列表 进行 排序 。 


3 创建 表 并 添加 列 


主要 的 目标 是 创建 表 并 指出 每 个 表 具 有 哪些 列 。 很 明显 这 个 问题 将 需要 一 张 表 来 存储 客户 
数据 ， 因 此 ， 右 击 主 绘制 窗 体 并 选择 选项 添加 一 张 表 。 然 后 ， 在 表 的 顶部 灰 颜 色 的 边 上 右 击 
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列 的 列表 
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， 4 


4 ee | 
状态 栏 一 一 和 idor pobem . Batic ceder problem 





反馈 窗 体 








图 2-2A DB 设计 界面 。 当 你 登录 后 ， 使 用 Fiie 菜 单 中 的 选项 来 打开 Order Problem 。 
Help 菜 单 中 有 一 个 选项 来 查看 问题 。 右 手边 的 窗 体 中 包含 一 个 可 用 列 的 列 
表 ， 它 们 将 被 放 入 表 中 。 选 择 Grade 菜单 选项 可 以 在 反馈 窗 体 中 生成 评注 


表 ， 选 择 重 命名 选项 。 输 入 “Customer” 提 供 一 个 新 名 字 。 

每 张 表 都 必须 有 一 个 主 码 一 一 一 个 或 多 个 列 能 惟一 标识 表 中 的 每 一 行 。 查 看 订单 表单 及 列 
表 中 的 列 ， 你 会 发 现 没 有 一 个 列 可 用 作 主 码 。 你 可 能 会 考虑 使 用 电话 号 码 ， 但 当 客 户 改 变 电 
话 号 码 时 会 出 现 问题 。 因 此 ， 最 好 的 办 法 是 生成 一 个 名 为 CustomerID 的 新 列 。 这 个 数字 的 值 
可 由 市 场 部 给 出 或 由 数据 库 系 统 自动 生成 。 要 创建 一 个 新 码 ， 将 Generate Key 项 从 列表 中 拖 放 
到 Customer 表 中 。 然 后 ， 右 击 列 名 ， 选 择 重 命名 选项 ， 输 入 CustomerID 作 为 新 的 名 称 。 注 意 ， 
现在 CustomerID 将 会 显示 在 Customer 表 中 并 作为 列表 中 的 一 个 新 列 。 此 外 ， 注 意图 2-3A 中 ， 
CustomerID 标 有 # 号 ， 表 明 它 是 Customer 表 主 码 的 一 部 分 。 通 过 右 击 列 你 可 以 将 列 设置 为 主 码 
或 取消 设置 为 主 码 。 当 你 双击 一 张 表 的 列 名 时 ， 表 会 自动 缩放 以 显示 它 所 有 的 列 。 

现在 表 和 主 码 都 已 建立 ， 你 可 以 向 表 中 添加 其 他 的 列 。 但 添加 哪些 列 呢 ? Customer 表 应 当 
包含 那些 能 标明 某 一 特定 客户 属性 的 列 。 因 此 ， 查 找 每 个 能 由 新 的 主 码 CustomerID 惟 一 标识 
的 列 ， 将 其 拖 放 到 Customer 表 中 。 

很 明显 这 个 数据 库 设 计 需 要 一 张 Order 表 。 添 加 一 张 新 表 ， 命 名 为 “Orders ， 并 生成 一 个 
主 码 OrderID。 同 样 ， 你 需要 选取 属于 Order 表 的 列 。 查 看 订单 ， 你 会 添加 OrderDate 列 。 注 意 ， 
订单 也 包含 客户 的 信息 。 但 要 求职 员 为 每 张 订单 输入 客户 的 姓名 和 地 址 是 一 种 浪费 。 因 此 ， 
你 只 需要 将 CustomerID 添 加 到 Order 表 中 。 记 住 ，CustomerID 不 是 Order 表 的 主 码 ， 因 为 每 张 订 
单 只 能 有 一 位 客户 。 如 果 将 它 设 为 主 码 ， 那 么 会 表明 一 个 订单 可 以 有 多 位 客户 参与 。 你 的 表 
应 当 与 图 2-4A 相 似 。 在 你 离开 以 前 一 定 要 保存 你 的 工作 。 如 果 时 间 过 长 ， 互 联网 连接 将 会 超 
时 ， 你 也 将 丢失 你 所 做 的 修改 。 
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图 2-3A 添加 一 个 表 和 码 。(1) 右 击 并 选择 Add 表 。(2) 右 击 临时 名 称 ， 选 择 
Rename， 输 入 新 名 称 。(3) 将 Generate Key 拖 放 到 表 上 。(4) 右 击 列 
名 并 重 命 名 


OrderDate 
CustomerlD 


Re TM EE 


图 2-4A 两 张 表 :每 张 表 代表 了 一 个 单独 的 实体 ， 所 有 列 都 是 为 该 实体 收集 的 
数据 。Orders 表 包含 CustomerID ， 它 提供 了 一 种 获取 Customer 表 中 对 
应 数据 的 方法 


4 关系 : 连接 表 


数据 库 系统 最 终 需 要 知道 ，Order 表 中 的 CustomerID 列 和 Customer 表 中 的 CustomerID 列 构 
成 的 关系 。 需 要 在 图 中 绘制 一 条 线段 ， 连 接 两 个 表 以 显示 这 种 关系 。 创 建 连接 最 简单 的 办 法 
是 将 CustomerID 列 从 Customer 表 中 拖 放 到 Order 表 中 的 CustomerID 列 。 第 二 步 是 指出 关系 每 一 
边 的 最 小 和 最 大 值 。 图 2-5A 表 明了 关系 的 选项 在 设计 视图 中 是 如 何 显示 的 。 在 此 例 中 ， 一 个 
订单 只 能 有 二 位 客户 ， 因 此 ， 客 户 的 最 小 值 和 最 大 值 都 是 1。 从 关系 的 另 一 方面 看 ， 每 位 客户 
可 以 提交 零 到 多 个 订单 。 有 些 人 可 能 争论 说 ， 如 果 一 位 客户 没有 提交 任何 订单 ， 那 么 他 或 她 
只 是 一 个 潜在 的 客户 ， 但 这 个 区 别 对 于 数据 库 并 不 重要 。 
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图 2-5A 关系 。 将 CustomerID 列 从 Customer 表 拖 放 到 Order 表 中 的 CustomerID 列 
上 。 然 后 为 关系 的 每 一 边 设置 最 小 值 和 最 大 值 。 一 个 订单 只 能 涉及 一 
位 客户 ， 而 一 位 客户 可 以 提交 零 到 多 个 订单 


5 评判 ， 检测 并 解决 问题 


你 将 会 重复 这 些 步骤 来 创建 数据 库 设计 : 添加 表 、 设 置 主 码 、 添 加 数据 列 、 连 接 表 。DB 
设计 系统 使 这 些 流程 变 得 相对 容易 ， 你 可 以 将 表 拖 搜 到 周围 以 更 好 地 显示 它 ， 你 可 以 保存 你 
的 工作 ， 等 一 会 回来 再 打开 它 继续 解决 问题 。 但 是 ， 你 仍然 不 知道 你 的 设计 是 好 是 坏 。 

考虑 向 订单 示例 问题 添加 另 一 张 表 。 为 Items 添 加 一 张 表 并 生成 一 个 新 主 码 叫做 ItemID 。 
添加 ItemDescription、ListPrice 和 QuantityOnHand 列 。 现 在 你 遇 到 的 问题 是 将 这 张 新 表 与 Order 
表 连 接 起 来 。 但 是 ， 到 目前 为 止 ， 它 们 没有 任何 相关 的 列 。 因 此 ， 作 为 一 种 实验 ， 尝 试 向 
Items 表 中 添加 OrderID 列 。 现 在 连接 OrderID 列 ， 建 立 从 Items 表 到 Orders 表 的 连接 ， 如 图 2-6A 
所 示 。 


# ltemlD 
ltemDescription 
ListPrice 
QuantityOnHand ， 
DrderlD 





3 ys 
人 我 


图 2-6A 创建 错误 。 要 描述 一 个 可 能 的 问题 ， 向 Item 表 中 添加 OrderID 列 ， 然 后 
将 它 与 Orders 表 进行 连接 
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你 随时 可 以 提交 当前 的 设计 ， 查 看 是 否 存 在 问题 。 事 实 上 ， 在 你 创建 表 的 时 候 最 好 进行 多 
次 检查 ， 以 便 能 尽早 发 现 问题 。 使 用 菜单 中 的 Grade 选 项 。 这 个 选项 会 在 窗 体 底部 生成 一 个 评 
注 列 表 。Grade to HTML 选 项 生成 相同 的 列表 ， 以 表格 方式 显示 在 单独 的 窗 体 中 。 

如 图 2-7A 所 示 ， 当 你 评判 这 个 问题 时 ， 你 得 到 一 个 合理 的 高 分 (88.3) 。 然 而 ， 也 有 几 条 
重要 的 评注 。 当 你 双击 一 条 评注 ， 系 统 高 亮 显示 这 个 错误 。 在 此 例 中 ， 大 部 分 评 广 指 出 Items 
表 存 在 问题 。 特 别 地 ，OrderID 列 显示 有 一 个 问题 。 这 个 问题 通过 关系 半 高 亮 显示 。 一 个 订单 
是 否 能 有 多 个 项 ? 如 果 你 重新 检查 图 2-1A ， 你 会 发 现 是 的 ， 一 个 订单 具有 多 行 可 以 表示 多 个 
项 。 你 可 以 尝试 修改 这 个 关系 ， 将 它 变 为 多 对 多 的 关系 ， 但 关系 数据 库 并 不 直接 支持 两 个 表 
之 间 的 多 对 多 关系 。 如 果 你 更 仔细 查看 Items 表 ， 你 会 发 现 问题 。 目 前 只 有 ItemID 作 为 主 码 。 
因为 OrderID 不 是 主 码 ， 因 此 每 一 项 只 能 出 现在 一 张 订单 上 ， 这 意味 着 每 一 项 只 能 售 出 一 次 。 


\ Tables:3 Comments:.5 Score:88.3 ”Clear marks. 
4 en dei ne A 
i ship leme dr om en ale te s be many of one? 





图 2-7A ”为 练习 评分 。 双 击 一 条 评注 以 突出 显示 引发 问题 的 表 和 列 。 使 用 评注 来 指 
出 引发 问题 的 表 和 列 。 在 此 例 中 ， 考 虑 为 什么 OrderID 列 不 应 属于 Item 表 

你 可 以 尝试 将 OrderID 与 ItemID 一 起 作为 主 码 。 试 着 进行 修正 ， 来 看 一 下 存在 的 问题 。 图 
2-8A 显 示 这 些 修 改 的 结果 。 首 先 ， 注 意 ， 分 数 降低 了 ! DB 设计 系统 仍然 指出 Orders 和 Items 之 
间 的 关系 存在 问题 ， 显 示 将 OrderID 作 为 主 码 存在 问题 。 特 别 地 ， 注 意 ，ItemID 被 创建 为 生成 
码 ， 因 此 它 总 能 保证 惟一 。 如 果 这 样 ， 那 么 在 此 表 中 你 永远 不 需要 第 二 个 列 。 

解决 方案 是 要 认识 到 关系 数据 库 不 直接 支持 两 个 表 之 间 的 多 对 多 关系 。 因 此 ， 你 必须 在 这 
两 个 表 之 间 插 入 一 个 新 表 。 在 此 例 中 ， 称 它 为 OrderItem 表 。 然 后 确保 从 两 个 相连 接 的 表 中 添 
加 两 个 主 码 列 (OrderID 和 ItemID)。 如 图 2-9A 所 示 ， 将 这 两 个 关系 添加 为 一 对 多 的 连接 。 注 
意 ， 这 里 Items 到 OrderItems 的 关系 指出 有 些 项 可 能 还 未 订购 过 。 
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# ltemlD 
ltemDescription 
istPri 


ListPrice 
x*| QuantityOnHand 
# DrderlD 


Should the relationship ltems - Orders on the table ltems be one or many? 
sre missing several tables. Most k are not finished 





图 2-8A 试 着 改正 问题 。 注 意 ， 分 数 降低 了 ， 因 此 “改正 ”实际 上 使 情况 变 得 
更 精 。OrderID 和 关系 中 存在 的 问题 并 没 解决 





图 2-9A 一 种 解决 方法 。 添 加 中 间 表 OrderItem 并 包含 两 张 表 的 码 (OrderID 和 
ItemID)。 利 用 一 对 多 关系 与 两 张 表 连 接 


从 分 数 可 以 看 出 ， 这 个 四 表 的 解决 方案 对 于 这 个 典型 的 订单 问题 来 说 是 最 好 的 数据 库 设 
计 方 案 。Customer 表 存储 关于 每 位 客户 的 数据 。Items 表 包含 描述 每 个 销售 项 的 行 。Orders 表 
提供 订单 号 、 日 期 和 一 个 到 提交 订单 客户 的 连接 。OrderItem 表 表示 订单 中 重复 的 部 分 ， 列 出 
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每 个 订单 中 购买 的 多 个 项 。 你 应 该 确认 初始 表单 中 的 所 有 数据 项 都 至 少 出 现在 最 后 的 某 一 个 
表 中 。 


6 指定 数据 类 型 


在 数据 库 设 计 完 成 之 前 需要 执行 一 个 额外 的 步骤 。 最 终 ， 这 个 设计 将 会 转化 为 数据 库 表 。 
当 你 创建 表 时 ， 需 要 了 解 存储 到 每 一 列 中 的 数据 的 类 型 。 例 如 ， 名 称 是 文本 ， 主 码 列 通常 是 
32 位 整数 。 确 保 所 有 的 日 期 和 时 间 都 赋予 Date 数 据 类 型 。 当 你 需要 浮 点 数 而 不 是 整数 时 需要 小 
心 核对 : 使 用 单 精度 或 是 双 精 度 取决 于 最 大 数值 将 会 是 多 少 。 图 2-10A 显 示 设 置 数据 类 型 的 方 
法 : 在 表 中 右 击 列 名 ， 移 动 光 标 选择 当前 的 数据 类 型 ， 然 后 移动 鼠标 选择 新 的 类 型 。 默 认 值 
是 常用 的 文本 类 型 。 这 样 ， 很 多 列 例如 客户 姓名 将 不 必修 改 。 





Tables:4 Comments0 Score:100 Clear marks. 





A ji 让 


gt 7 才 训 


图 2-10A 数据 类 型 。 右 击 列 名 然后 设置 其 数据 类 型 。 默 认 是 Text， 因 此 你 不 必 
修改 一 般 的 列 ， 例 如 客户 姓名 。 码 列 通常 是 32 位 整 型 





第 3 章 


数据 规范 化 





本 章 学 习 内 容 


“为 什么 重复 组 需要 放 到 单独 的 表 中 ? 

“规范 化 的 三 条 主要 规则 是 什么 ? 

“ 当 表 中 存在 隐 式 依赖 时 会 产生 什么 问题 ? 

。 为 了 保证 数据 完整 性 ，DBMS 要 强制 实施 什么 类 型 的 规则 ? 
“DBMS 如 何 保持 多 个 表 中 的 数据 一 致 性 ? 

。 如何 将 一 个 类 图 转化 为 规范 的 表 ? 

“ 如何 估 计数 据 库 的 大 小 ? 


3.1 开发 漫谈 


Miranda:， 真 有意思， 我 对 公司 的 流程 和 规则 有 了 很 多 了 解 。 我 想 我 已 经 把 每 一 件 事 情 
都 完全 记录 在 类 图 里 了 ， 并 且 在 数据 字典 中 作 了 一 些 记录 。 

Ariel. 真 棒 ! 我 们 今天 晚上 应 该 去 听 音 乐 会 庆祝 一 下 。 

Miranda:， 我 可 以 放松 一 个 晚上 了 。 或 许 让 我 的 脑 细 胞 休息 一 下 能 让 我 搞 清 楚 下 一 步 该 
做 什么 。 

Ariel， 你 的 意思 是 什么 ? 你 觉得 这 个 项 目 要 花费 多 长 时 间 ? 

Miranda， 正 是 这 个 问题 。 我 这 一 段 的 所 有 时 间 都 花 进去 了 ， 但 事实 上 我 还 一 点 都 没有 
开始 做 这 个 项 目 。 

Ariel， 唔 ， 数 据 难道 不 是 构建 一 个 数据 库 应 用 程序 最 重要 的 方面 吗 ? 我 听 说 数据 库 
系统 挺 难 对 付 的 。 你 必须 第 一 次 就 正确 地 定义 数据 ;否则 ， 你 将 不 得 不 重新 
开始 。 

Miranda; 或 许 你 是 对 的 。 我 计划 用 这 个 晚上 来 放松 一 下 ， 然 后 我 要 研究 一 下 这 些 规则 ， 
看 看 怎样 将 类 图 转化 为 一 组 数据 库 表 。 


3.2 简介 


数据 库 是 一 个 强 有 力 的 工具 ， 相 比 传统 的 编程 和 层次 文件 具有 很 多 优点 。 然 而 ， 只 有 正确 
地 进行 数据 库 设 计 ， 才 能 获得 这 些 优点 。 回 忆 一 下 ， 数 据 库 是 表 的 集合 。 本 章 的 目标 是 教会 
你 如 何 为 数据 库 设计 表 。 
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数据 规范 化 的 本 质 在 于 将 数据 划分 到 多 个 表 中 ， 依 据 表 中 的 数据 ， 这 些 表 相 互 连 接 。 机 械 
地 说 ， 这 个 过 程 不 是 很 难 。 大 致 需要 学 习 四 条 规则 。 另 一 方面 ， 表 是 为 处 理 的 特殊 业务 或 应 
用 而 设计 的 。 因 而 ， 必 须 首先 了 解 业务 ， 表 必须 符合 业务 规则 。 因 此 ， 设 计 一 个 数据 库 的 挑 
战 在 于 必须 首先 理解 业务 如 何 运 转 ， 它 的 规则 是 什么 。 这 些 规则 中 的 一 部 分 在 第 2 章 有 所 涉及 ， 
集中 体现 在 关系 上 。 业 务 关系 (一 对 一 和 一 对 多 ) 组 成 了 数据 规范 化 的 基础 。 这 些 关系 对 于 
如 何 建立 数据 库 起 至 关 重 要 的 作用 。 这 些 规 则 因 公 司 的 不 同 而 变化 ， 有 时 其 至 取决 于 企业 中 
与 你 进行 交流 的 那个 人 。 因 此 ， 当 你 创建 数据 库 时 ， 需 要 建立 一 张 公司 如 何 运 转 的 图 景 。 与 
多 个 人 交流 来 理解 数据 之 间 的 关系 。 数 据 规范 化 的 目标 在 于 确定 业务 规则 ， 以 便 能 设计 出 合 
理 的 数据 库 表 。 

要 仔细 设计 数据 库 表 ， 需 要 (1) 节约 空间 ，(2) 最 小 化 重复 ，(3) 保护 数据 以 确保 其 一 
致 性 ，(4) 通过 传送 少量 数据 提供 快速 事务 。 定 义 数 据 库 表 的 方法 之 一 是 使 用 第 2 章 介绍 的 给 
图 方法 建立 一 个 类 图 。 另 外 一 种 方法 是 收集 基本 的 文书 ， 从 你 可 能 会 用 到 的 每 张 表单 和 每 个 
报表 开始 。 然 后 将 各 个 数据 集合 拆 开 ， 分解 到 各 个 表 中 。 大 部 分 人 发 现 将 这 两 种 方法 结合 是 
最 有 效 的 。 但 本 章 将 从 分 别 描述 这 两 种 方法 开始 。 


3.3 表 、 类 和 码 


第 2 章 关注 确定 业务 类 和 业务 关联 。 现 在 ,需要 更 仔细 地 定义 这 些 类 ， 以 便 能 将 它们 转换 
为 数据 库 表 。 当 然 ， 当 你 修改 表 时 ， 也 会 更 新 类 图 。 类 之 间 的 关系 对 于 最 终 表 的 形式 起 决定 
作用 。 这 些 关 系 也 以 表 的 主 码 方式 呈现 。 主 码 由 能 惟一 确定 每 一 行 的 列 的 集合 组 成 。 由 于 码 
必须 始终 保证 惟一 ， 因 此 通常 创建 一 个 新 列 来 存储 生成 的 主 码 。 但 是 ， 很 多 情况 下 ， 你 会 使 
用 多 个 列 来 组 成 主 码 。 这 些 情 形 十 分 重要 ， 需 要 进行 详细 阐述 。 


3.3.1 复合 码 


在 很 多 情况 下 ， 设 计数 据 库 的 时 候 ， 会 使 用 多 
个 列 作为 表 的 一 部 分 主 码 。 这 称 为 复合 码 。 当 菜 个 
表 包 含 与 另 一 个 表 存 在 一 对 多 或 多 对 多 的 关系 时 ， god mr 
需要 使 用 复合 码 。 - 

复合 码 的 例子 如 图 3-1 中 的 Orderltems 表 所 示 。 
这 两 个 表 在 业务 中 很 常见 ， 它 们 组 成 了 主 从 或 父子 
关系 。Order 表 很 简单 。 它 只 有 一 列 作为 主 码 ， 就 是 
你 所 创建 的 OrderID 。 这 张 表 包 含 关于 某 一 订单 的 基 
本 信息 ， 包 括 日 期 和 客户 。OrderItems 表 使 用 两 列 
作为 码 ， OrderID 和 Item。Orderltems 表 的 目的 是 说 
明 客 户 选择 购买 哪些 商品 。 这 样 设计 主 码 的 关键 之 - 
处 在 于 每 张 订单 可 以 包含 多 件 不 同 的 商品 。 在 此 例 人 
中 ，OrderID 为 8367 的 有 三 项 。 由 于 每 张 订单 可 以 有 对 多 的 关系 。 每 个 订单 可 以 包含 多 个 
很 多 不 同 的 商品 ， 因 此 ，Item 必 须 作为 主 码 的 一 部 商品 (由 实 箭头 表示 )。 每 个 商品 可 
分 。 从 左 向 右 阅读 表 的 描述 ， 可 以 看 到 每 个 OrderID 以 出 现在 多 张 不 同 的 订单 上 ( 虚 箭 头 ) 
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可 以 有 很 多 Items。“ 多 ”说 明 Item 必 须 成 为 主 码 。Order[tems 表 的 另 一 个 方向 又 如 何 呢 ? 是 否 真 
正 需要 OrderID 作 为 主 码 ? 答案 是 肯定 的 ， 因 为 公司 可 以 将 相同 的 商品 售 给 不 同 的 人 (或 在 不 同 
的 订单 中 售 给 相同 的 客户 ) 。 例 如 ，Item 为 229 出 现在 OrderID 为 8367 和 8368 中 。 因 为 每 一 项 可 以 
出 现在 不 同 的 订单 中 ， 因 此 ，OrderID 必 须 成 为 主 码 的 一 部 分 。 作 为 对 照 ， 重 新 考虑 图 3-1 中 的 
Orders 表 。 每 个 OrderID 只 能 拥有 一 个 Customer， 因 此 ， 不 必 将 Customer 作 为 主 码 。 

为 了 确保 你 理解 主 码 和 关系 如 何 相互 作用 ， 再 看 一 遍 Orderltems 表 。 看 看 IHemID 列 ， 问 问 
你 自己 ， 对 于 每 个 OrderID ， 能 有 一 个 还 是 多 个 ItemID? 如 果 回 答 是 多 个 ， 那 么 ItemID 必 须 设 
为 主 码 〈 加 下 划 线 )。 现 在 ， 看 看 OrderID 列 然后 问 自己 ， 一 个 ItemID 能 否 出 现在 一 张 或 多 张 订 
单 上 ? 回答 仍然 是 肯定 的 ， 因 此 ，OrderID 也 必须 设 为 主 码 。 

看 看 Order 表 中 的 CustomerID 列 ， 然 后 发 问 : 对 于 每 张 订 单 ， 能 有 一 个 或 者 多 个 客户 吗 ? 
通常 的 业务 规则 回答 说 每 张 订单 只 能 有 一 个 客户 ， 因 此 ，CustomerID 不 是 主 码 的 一 部 分 。 另 
一 方面 ， 由 于 CustomerID 是 Customer 表 的 主 码 ， 它 就 认为 是 Order 表 的 外 码 。 把 它 想象 为 一 位 
外 国 要 人 访问 一 个 不 同 的 国家 ( 表 )。Order 表 中 需要 CustomerID 列 ， 因 为 后 者 作为 一 个 指向 
Customer 表 中 其 他 用 户 数据 的 连接 。 

要 想 适 当地 规范 化 数据 并 将 其 尽 可 能 有 效 地 进行 存储 ， 必 须 合理 地 确定 主 码 。 对 于 主 码 的 
选择 取决 于 业务 关系 ， 企 业内 的 术语 以 及 公司 内 一 对 多 和 多 对 多 的 关系 。 


3.3.2 代理 码 


要 确保 现实 世界 中 的 数据 总 是 生成 惟一 的 码 是 很 困难 的 。 因 此 ， 通 常 需要 数据 库 系 统 生成 
它 自 己 的 码 值 。 这 些 代理 码 只 在 数据 库 内 部 使 用 ， 而 且 通 常 是 隐 含 的 ， 因 此 ， 用 户 其 至 不 知 
道 它们 的 存在 。 例 如 ， 数 据 库 系统 会 为 每 个 客户 赋予 一 个 惟一 的 码 ， 而 职员 将 会 通过 常规 的 
数据 如 姓名 和 地 址 查找 客户 。 当 业务 码 具 有 某 种 不 确定 性 时 ， 代 理 码 就 显得 尤为 有 用 。 考 虑 
你 可 能 会 遇 到 的 这 个 问题 : 一 个 公司 每 两 年 改变 一 次 它 的 产品 号 格式 。 如 果 你 依赖 于 业务 码 ， 
那么 你 必须 相信 它们 总 是 一 致 的 ， 并 且 从 来 不 会 重复 。 

当 数 据 库 变 得 很 大 时 ， 代 理 码 的 使 用 很 需要 技巧 。 在 有 很 多 并 发 用 户 的 情形 下 ， 创 建 惟一 
的 数字 变 得 更 加 困难 。 此 外 ， 在 大 型 数据 库 中 代理 码 会 引发 很 多 性 能 问题 。 例 如 ， 生 成 代理 
码 的 常用 方法 是 找到 现 有 的 最 大 码 值 ， 然 后 增加 它 。 如 果 两 个 用 户 同时 要 产生 一 个 新 码 ， 将 
会 发 生 什 么 呢 ? 一 个 优秀 的 DBMS 能 自动 处 理 这 些 问题 。 

Mircosoft Access 使 用 自动 标识 这 种 数据 类 型 来 为 主 码 列 生成 惟一 的 数字 。 类 似 地 ，SQL 
Server 使 用 Identity 数 据 类 型 。 Oracle 具 有 一 个 SEQUENCES 命 令 来 生成 惟一 的 数字 ， 但 它 与 
Microsoft 的 运行 方式 不 同 。 作 为 一 个 程序 员 ， 当 一 个 新 行 插入 时 ， 你 生成 并 使 用 新 值 这 个 过 
程 并 不 是 自动 的 。 这 两 种 方法 都 有 优 缺 点 。Microsott 方 法 的 最 大 困难 在 于 当 新 的 一 行 插入 时 
有 时 很 难 获得 新 值 。Oracle 方 法 的 缺点 在 于 你 必须 保证 所 有 用 户 和 开发 者 在 整个 应 用 中 都 使 用 
恰当 的 数字 生成 命令 。 此 外 ， 两 种 方法 在 转移 数据 一 一 尤其 是 转移 到 其 他 数据 库 系统 中 时 都 可 
能 引发 问题 。 


3.3.3 标记 | 
一 张 详细 的 类 图 能 描述 每 张 表 ， 包 含 每 个 类 中 的 所 有 属性 并 标记 主 码 列 。 使 用 类 图 的 优点 
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在 于 突出 类 之 间 的 关联 。 此 外 ， 可 视 化 的 表示 能 使 一 些 人 更 好 地 理解 系统 。 图 3-2 显 示 了 一 张 
简单 示例 类 图 ， 但 省 略 了 属性 。 

类 图 的 缺点 在 于 它们 可 能 会 变 得 非常 大 。 
当 有 30 个 类 时 ， 将 所 有 信息 放 在 一 页 上 变 得 
很 困难 。 而 且 ， 很 多 关联 线段 相互 交叉 ， 使 
得 类 图 很 难 阅读 。CASE 工 具有 助 于 解决 部 ， 
分 上 述 问题 ， 使 你 只 查看 类 图 的 一 小 部 分 。 

然而 ， 你 也 可 以 使 用 简短 的 标记 ， 如 
图 3-3 所 示 。 标 记 由 一 个 表 的 列表 组 成 。 每 一 
列 由 表 名 列 出 。 主 码 加 了 下 划 线 ， 一 般 首先 
列 出 。 这 种 标记 很 容易 手写 或 通过 电脑 输入 ， 图 3-3 一 个 基本 订购 系统 的 小 规模 类 图 。 数 字 指 示 
在 一 个 小 空间 内 它 可 以 显示 很 多 表 。 然 而 ， 关系 。 例 如 ， 每 位 客户 可 以 提交 多 个 订单 ， 
显示 表 之 间 的 关系 非常 困难 。 你 可 以 在 表 之 但 一 张 订单 只 能 来 自 一 位 客户 
间 画 箭头 ， 但 这 样 会 变 得 很 凌乱 。 





Customer (CustomerID, Name, Address, City, Phone) 
Salesperson (EmployeeID, Name, Commission, DateHired) 
Order (OrderID, OrderDate, CustomerID, EmployeeID) 


OrderItem(QrderID, ItemID, Quantity) 
Item(ItemID, Description, ListPrice) 





图 3-3 表 标 记 。 从 一 个 表 的 简单 列表 中 更 容易 看 出 列 的 详细 信息 。 这 个 列表 还 
在 把 表 输 入 到 数据 库 中 时 起 作用 

设计 者 通常 既 创建 类 图 也 创建 表 的 列表 。 列表 确定 所 有 的 列 和 码 。 类 图 显示 表 之 间 的 关系 。 
类 图 还 可 以 包含 附加 的 详细 信息 ， 例 如 存在 的 限制 和 最 小 值 要 求 。 

考虑 图 3-4 所 示 的 小 型 客户 记 账 系统 。 基 本 数据 包括 客户 和 助手 。 你 可 能 会 有 一 个 关系 显 
示 分 配给 每 个 客户 的 助手 。 你 还 想 记录 助手 为 每 位 客户 所 做 的 工作 量 。Client 和 Partener 表 使 用 
专门 创建 的 列 作为 主 码 。 这 样 你 不 必 担心 主 码 不 惟一 或 可 能 存在 重复 姓名 的 问题 。 记 住 ， 客 
户 和 助手 都 不 必 知道 他 们 的 标识 号 。 第 8 章 将 介绍 如 何在 查找 客户 数据 的 同时 隐藏 主 码 值 。 


Client (ClientID, Name, Address, BusinessType) 
Partner (PartnerID, Name, Speciality, Office, Phone) 


partnerAssignment (PartnerID, ClientID, DateAcquired) 
Billing (ClientID, PartnerID, Date/Time, Item, 
Description, Hours, AmountBilled) 





图 3 了 4 客户 记 账 示例 。 注 意 ， 业 务 规则 规定 每 位 客户 可 以 分 配 多 个 助手 ， 因 而 
PaitnerID 和 ClientID 都 成 为 PartnerAssignment 表 的 主 码 
注意 ， 在 PartnerAssignment 表 中 ，PartnerID 和 ClientID 设 为 主 码 。 仅 仅 通过 将 表 写 为 这 种 
形式 ， 你 就 能 提出 关于 这 个 公司 如 何 运 行 的 假设 。 首 先 ， 每 位 助手 为 多 个 客户 执行 任务 一 这 
很 平常 。 此 外 ， 每 位 客户 可 以 分 配 多 个 助手 。 这 第 二 个 假设 在 一 些 公司 当中 可 能 行 不 通 。 较 
小 的 公司 可 能 只 将 一 位 主要 助手 分 配给 每 个 客户 。 如 果 一 个 不 同 的 助手 为 某 位 客户 完成 任务 ， 
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那么 这 个 客户 仍 能 在 记 账 表 中 列 出 。PartnerAssignment 表 中 主 码 的 选择 取决 于 公司 业务 运行 的 
方式 。 

图 3-5 描 述 了 当 公 司 规定 每 位 客户 只 能 分 配 一 个 主要 助手 时 将 会 发 生 什么 。 在 这 种 情况 下 ， 
PartnerID 不 再 作为 PartnerAssignment 表 的 主 码 。 还 要 注意 ，Client 和 PartnerAssignment 表 具有 相 
同 的 主 码 (ClientID)。 如 果 这 些 主 码 是 正确 的 ， 那 么 列 应 当 合 并 到 一 张 表 中 (Client)。 没 有 理 
由 存在 具有 相同 主 码 的 两 张 表 。 这 样 ， 第 二 个 公司 的 数据 表 将 会 与 第 一 个 公司 的 不 同一 一 只 
为 它们 的 业务 流程 不 同 。 









Client(ClientiD, Name, Address, BusinessType) 













Partner(PartineriD, Name, Speciatty, Office, Phone) 





PartnerAssignment(PartneriD, CiientiD, DateAcquired) 








Biiling(ClientiD, PartneriD, Date/Time, ftem, Description, Hours, AmouatBilled} 












图 3-5 简化 的 客户 记 账 系统 。 如 果 每 位 客户 只 能 分 配 一 个 主要 助手 ， 那 么 
PartnerID 就 不 应 设 为 PartnerAssignment 表 中 的 主 码 。 但 是 ， 现 在 Client 
表 和 PartnerAssignment 表 都 有 相同 的 主 码 (ClientID)。 因 此 ， 两 个 表 中 
的 列 应 当 合并 到 同一 个 表 中 (Client) 


图 3-6 所 示 的 Billing 表 具有 三 个 主 码 列 ，ClientID，PartnerID 和 Date/Time。 这 样 的 主 码 表 
明 对 于 每 位 客户 ， 很 多 助手 可 以 为 他 完成 任务 。 反 过 来 ， 每 个 助手 能 为 很 多 不 同 的 客户 服务 。 
同样 ， 每 位 客户 可 以 让 每 个 助手 在 不 同时 间 多 次 完成 任务 。 如 果 你 不 将 Date/Time 设 为 主 码 ， 
那样 每 位 客户 可 以 给 很 多 助手 付 账 ， 但 每 个 助手 只 能 有 一 次 。 尽 管 有 了 这 种 限制 客户 会 非常 
兴 ， 但 这 不 是 使 用 此 数据 库 的 公司 的 实际 观点 。 如 果 不 将 Date/Time 设 为 主 码 ， 就 会 出 现 第 1 
行 和 第 3 行 不 再 惟一 的 问题 。 为 了 测试 主 码 ， 键 和 人 示 例 数据 并 覆盖 其 他 列 。 观 察 表 中 的 前 两 列 ， 
你 就 会 发 现 第 1 行 和 第 3 行 的 前 两 项 是 重复 的 。 要 解决 这 个 问题 ， 你 不 得 不 问 ， 一 个 助手 如 何 
多 次 为 一 位 客户 服务 ? 回答 是 任务 必须 在 不 同 的 时 间 完 成 。 这 样 ，Date/Time 列 就 添加 成 为 主 
码 的 一 部 分 。 


Biiling 
Clientip PartneriD Date/Time Item Description Hours AmountBilled 


115 963 8-4-04 10:03 967 Stress analysis 2 $500 
295 967 8-5-04 11:15 754 New Design 3 $750 
115 963 8-8-04 09:30 967 Stress analysis 2.5 $650 





图 3-6 Billing 表 的 示例 数据 。 注 意 ，Partner963 可 以 为 Client115 多 次 完成 相同 
的 任务 。 因 为 Date/Time 是 主 码 的 一 部 分 
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现在 你 已 经 可 以 看 到 业务 规则 如 何 影响 数据 库 设计 。 主 码 的 选取 很 大 程度 上 取决 于 业务 关 
系 ， 而 在 每 个 企业 都 可 能 不 同 。 要 小 心地 双重 检查 你 设置 的 所 有 主 码 。 如 果 在 设置 主 码 上 出 
错 ， 将 很 难 使 数据 库 的 其 他 部 分 正确 。 在 简单 实体 〈 客 户 、 雇 员 等 等 ) 的 情形 下 ， 你 通常 需 
要 创建 惟一 的 主 码 。 对 于 更 复杂 的 实体 ， 你 需要 观察 一 对 多 和 多 对 多 的 关系 。 你 可 以 这 样 检 
查 复合 码 : 看 着 第 一 个 加 下 划 线 的 列 (ClientID)， 然 后 发 问 ， 对 于 所 有 其 他 加 下 划 线 的 列 
(在 此 例 中 ，PartnerID)， 存 在 很 多 这 样 的 助手 吗 ? 如 果 存 在 ， 此 列 应 当 设 为 主 码 。 如 果 只 有 
一 个 条 目 ， 那 么 此 列 不 应 设 为 主 码 。 确 保 也 这 样 检查 相反 的 关系 (从 PartnerID 到 ClientID)。 


3.4 音像 店 的 示例 数据 库 


介绍 数据 规范 化 的 最 好 方法 是 研究 一 个 示例 问题 。 记 住 ， 你 获得 的 结果 (创建 的 表 ) 很 大 
程度 上 取决 于 特定 的 例子 和 所 做 的 假设 。 下 面 的 例子 用 到 了 大 部 分 学 生 都 很 熟悉 的 场景 : 音 
像 店内 的 主要 业务 。 

音像 店 最 重要 的 功能 是 检查 录像 带 以 供 租赁 。 一 个 检查 界面 示例 如 图 3-7 所 示 。 


可 能 的 主 码 重复 部 分 


一 


Green's Vides Sotors NBw | cloke | 


ey 
4/18/2004 11:03.56 AM| 


rT nS TT 
| $300 





,图 3-7 录像 带 租 赁 界面 。 首 先 查 找 可 能 的 主 码 ， 记 住 重复 部 分 (一 对 多 关系 ) 
将 最 终 需 要 连接 码 


示例 表单 的 主要 组 成 部 分 是 客户 和 出 租 的 录像 带 。 在 数据 库 中 建立 表单 后 ， 会 自动 显示 总 
金额 。 它 还 应 当 自 动 生成 惟一 的 RentalID 。 注 意 ， 表 单 还 有 按钮 和 控件 用 于 帮助 用 户 更 容易 输 
和 人 数据。 表单 和 控件 将 在 第 5 章 讨论 。 目 前 ， 在 你 与 经 理 交谈 后 ， 你 应 该 获得 表单 要 提供 的 功 
能 。 可 以 计算 的 值 (如 subtotals) 应 当 标记 ， 需 要 的 话 ， 应 当 提 供 适当 的 计算 公式 。 在 大 多 数 
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情况 下 ， 不 希望 将 计算 得 到 的 数值 存储 到 数据 表 中 。 
3.4.1 初始 对 象 


从 确定 所 需 的 主要 对 象 开 始 。 显 而 易 见 的 是 客户 和 录像 带 。 在 实际 生活 中 还 会 有 雇员 ， 出 
租 录 像 机 ， 还 可 能 销售 其 他 东西 ， 但 现在 你 可 以 忽略 那些 东西 。 然 而 ， 经 理 还 需要 记录 谁 租 
了 特定 的 录像 带 。 例 如 ， 一 盘 录 像 带 没有 按时 归还 ， 经 理 需 要 知道 该 去 找 谁 。 这 样 ， 你 还 需 
要 两 个 对 象 。 第 一 个 是 事务 对 象 ， 它 记录 日 期 和 客户 。 第 二 个 是 那个 客户 当时 租 的 录像 带 的 
列表 。 

检查 图 3-8 所 示 的 初始 对 象 。 你 需要 为 Customer (和 Video) 设置 主 码 。 显 然 ，Name 不 行 ， 
但 你 可 能 会 考虑 使 用 Phone 号 码 。 这 种 方法 可 能 行 ， 但 它 以 后 可 能 造成 一 些 困 难 。 例 如 ， 如 果 
一 个 客户 拥有 了 一 个 新 的 电话 号 码 ， 就 必须 在 与 他 相关 的 每 个 表 中 修改 相应 的 号 码 。 作 为 一 
个 主 码 ， 它 可 能 出 现在 多 个 不 同 的 表 中 。 当 客户 (Adams) 搬家 时 ， 会 引发 更 大 的 问题 ， 电 话 
公司 在 几 个 月 后 会 将 Adams 不 再 用 的 电话 号 码 重新 分 配给 另 一 个 人 (Brown)。 如 果 Brown 在 你 
的 店 里 开 账 户 ， 你 的 数据 库 很 可 能 错误 地 将 Brown 当 成 Adam。 最 安全 的 方法 是 让 数据 库 为 每 
一 个 客户 创建 一 个 新 号 码 。 


Customer Assign CustomerlD | Name 
Address 
Phone 
Video Assign MovielD Titie 
Rentalprice 
. Rating 


RentalTransaction | Assign TransactioniD | CustomeriD Event/Relationship 
Date 
VideosRented TransactioniD + VideoCopy# Event/Repeating list 
MovielD 


图 3-8 音像 店 的 初始 对 象 。 注 意 ， 事 务 包括 两 部 分 ，RentalTransaction 和 
VideosRented， 因 为 一 次 可 以 租 很 多 录像 带 


Video 对 象 (可 能 包括 视频 游戏 ) 也 需要 一 个 主 码 。 实 际 当 中 你 或 许可 以 使 用 出 版 商 提供 
的 产品 标识 。 目 前 ,单独 分 配 一 个 号 码 是 最 简单 的 。 常 用 的 属性 包括 Title、Rating、 
Description 和 RentalPrice。 如 果 需 要 ， 将 来 可 以 添加 更 多 的 属性 。 

每 个 事务 必须 记录 。 一 个 事务 是 一 个 事件 ， 它 指出 某 位 客户 租 某 一 盘 录 像 带 和 租赁 发 生 的 
时 间 。 这 个 对 象 涉及 到 基本 的 租赁 表单 ， 并 且 分 配 了 一 个 惟一 的 主 码 值 。 记 住 这 种 方法 。 几 
乎 所 有 你 遇 到 的 问题 都 能 以 一 张 表 解决 ， 这 张 表 存储 基础 表单 或 报表 中 的 数据 。 

很 多 情况 下 重复 部 分 的 出 现 是 一 个 很 重要 的 问题 ， 它 可 能 在 存储 数据 时 引发 问题 (参见 
“重复 部 分 的 问题 *) 。 这 样 ， 重 复 部 分 从 主事 务 中 分 开 ， 并 存储 在 它 自己 的 表 中 。 这 里 的 主 码 
包括 Transaction 表 的 TransactionID 列 和 VideoID 列 。 注 意 ， 主 码 是 复合 码 ， 因 为 存在 多 对 多 的 
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关系 。 一 位 客户 一 次 可 以 租 很 多 录像 带 ， 一 盘 录 像 带 (在 不 同 的 时 间 ) 可 以 租 给 多 位 客户 。 

VideosRented 表 中 的 VideoCopy# 瑚 示 租 出 的 是 电影 的 哪 份 拷贝 (一 部 电影 有 多 份 拷贝 ) 。 
当 电影 送 还 时 ， 拷 贝 号 告知 经 理 是 谁 送 还 了 录像 带 。 注 意 ， 你 可 以 选择 把 VideoCopy 帮 有 为 主 
码 。 如 果 VideoCopy# 不 是 主 码 (就 像 现在 这 样 ) 相应 的 业务 假设 就 是 一 位 客户 可 以 租 许多 电 
影 ， 但 只 能 租 该 电影 的 一 份 拷贝 。 以 这 种 方式 设计 数据 库 ， 规 定 一 位 客户 永远 不 能 同时 租 同 
一 部 电影 的 两 份 拷贝 。 这 是 否 合理 的 假设 依赖 于 具体 业务 。 如 果 你 这 样 建立 数据 库 ， 一 个 客 
户 永远 不 能 一 次 租 某 一 电影 的 多 份 拷贝 。 如 果 一 位 客户 想 要 租 两 个 拷贝 ， 你 将 不 得 不 另 写 一 
个 事务 。 


3.4.2 初始 表单 评估 


如 果 没 有 经 过 实践 ， 想 要 确定 图 3-9 所 示 的 四 张 表 是 很 困难 的 。 大 部 分 人 能 识别 Customer 
和 Video 表 。 一 部 分 人 会 发 现 需要 RentalTransaction 表 。 然 而 ， 对 VideosRented 表 的 用 途 就 不 那 
么 清楚 了 。 幸 运 的 是 ， 有 一 种 方法 通过 将 整个 表单 分 解 得 到 每 张 表 。 这 种 方法 就 是 数据 规范 
化 的 方法 ， 它 是 遵循 业务 假设 的 一 种 机 械 过 程 。 

图 3-9 显 示 了 初始 表单 评估 的 第 一 步 。 当 你 刚 开始 学 习 规 范 化 时 ， 应 当 很 小 心地 进行 这 一 
步 。 熟 练 以 后 ， 可 以 选择 跳 过 这 一 步 。 这 个 过 程 是 遍历 表单 或 报表 ， 记 录 所 有 你 要 存储 的 东 
西 。 目 标 是 写成 一 种 结构 化 的 格式 。 


RentalForm(TransID, RentDate, CustomerID, Phone, Name, Address, City, State, ZipCode, 
(VideolD, Copy#, Title, Rent ) ) 


9 从 用 户 方 收集 表单 
2 记录 属性 
2 查找 重复 组 

2 查找 可 能 的 主 码 

2 确定 通过 计算 得 到 的 值 
2 标记 使 得 确定 和 解决 问 
题 更 加 容易 

2 结果 等 价 于 类 图 ， 但 会 
占用 二 页 或 两 页 四 


oreen's Video Store 


Ween's Video Store 1 New | | ; Close | 


[3 


Cr 7 
: | 





图 3-9 初始 表单 评估 。 一 旦 收集 完 基本 的 用 户 表单 ， 就 可 以 将 它们 转化 为 更 简 
洁 的 标记 。 这 种 标记 通过 强调 可 能 的 问题 使 规范 化 的 步骤 更 简单 
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为 表单 起 一 个 名 称 ， 然 后 列 出 所 有 的 项 作为 列 名 。 你 可 以 从 表单 的 左上 和 角 开 始 ， 逐 个 为 每 
个 数据 元 素 写 下 列 名 。 试 着 将 项 排列 在 一 起 ， 形 成 自然 的 组 ， 例 如 所 有 的 客户 数据 。 
RentalForm 以 TransID 开 始 ， 看 起 来 可 以 作为 一 个 不 错 的 主 码 。 接 下 来 列 出 RentDate 和 
CustomerID ， 紧 接着 是 基本 的 客户 数据 。 下 一 步 稍微 有 些 复杂 ， 因 为 你 需要 表示 出 包含 录像 
带 数 据 的 重复 部 分 。 即 ， 具 有 很 多 行 数据 或 可 能 存在 若干 相似 项 。 重 复数 据 代 表 一 对 多 的 关 
系 ， 需 要 小 心 处 理 。 表 示 重 复 部 分 的 一 个 简单 方法 是 将 它 放 在 另 一 组 括号 中 。 有 些 人 将 它 列 
在 新 行 中 。 

注意 ， 这 里 并 不 包含 计算 得 到 的 属性 (小 计 、 税 和 总 计 )， 因 为 它们 可 以 在 需要 的 时 候 重 
新 计算 得 到 。 然 而 ， 有 些 情况 下 ， 你 可 能 希望 存储 计算 得 到 的 数据 。 将 这 些 列 与 这 个 表单 放 
在 一 起 时 一 定 要 小 心 一 一 不 要 将 它 放 在 重复 数据 部 分 中 。 另 外 ， 还 应 当 标记 这 些 项 ， 或 者 在 数 
据 字典 中 做 个 标记 ， 以 便 记 住 它们 是 通过 计算 得 到 的 值 。 

在 你 进行 第 一 步 时 ， 一 定 要 记 下 你 想 要 在 数据 库 中 存储 的 每 一 项 。 另 外 ， 确 信 标 识 了 每 一 
个 重复 的 部 分 。 这 里 你 要 多 加 小 心 。 有 时 候 重复 部 分 是 很 明显 的 : 它们 可 能 在 一 个 单独 的 区 
域 ， 用 不 同 颜色 突出 显示 ， 或 者 包含 示例 数据 使 你 能 看 见 重复 。 而 另 一 些 时 候 ， 重 复 部 分 就 
不 那么 明显 了 。 例 如 ， 在 较 大 的 表单 中 ， 重 复 部 分 可 能 出 现在 单独 的 数 页 里 。 其 他 时 候 ， 一 
些 条 目 看 上 去 似乎 并 不 重复 。 例 如 电话 号 码 : 在 一 个 商业 环境 中 ， 有 些 客户 只 有 一 个 电话 号 
码 ， 但 另 一 些 可 能 有 好 几 个 : 办 事 处 、 办 公 室 、 手 机 、 寻 呼 机 等 等 。 如 果 你 需要 存储 多 个 电 
话 号 码 ， 那 么 它们 就 成 为 重复 的 条 目 ， 需 要 进行 标记 。 例 如 ， 电 话 号 码 可 以 存储 为 
(PhoneType，Number) 。 在 这 种 时 候 你 还 应 当 试 着 标 出 可 能 的 主 码 ， 为 了 指出 重复 的 部 分 ， 同 
时 也 突出 那些 你 知道 将 会 包含 惟一 数据 的 列 。 


3.4.3 重复 部 分 的 问题 


你 必须 小 心 指明 重复 部 分 或 一 对 多 关系 的 原因 在 于 它们 在 数据 库 中 可 能 引发 问题 。 图 3-10 
说 明了 当 你 试 着 按照 现在 列 出 的 格式 存储 表单 中 的 数据 时 会 产生 的 问题 。 这 种 初始 格式 存在 的 
第 一 个 问题 是 包含 重复 数据 。 例 如 ， 客 户 每 租 一 盘 录 像 带 ， 职 员 都 必须 重新 输入 地 址 、 电 话 等 
等 ， 这 是 因为 重复 数据 与 基本 数据 放 在 同一 张 表 中 。 因 此 ， 每 盘 出 租 的 录像 带 都 需要 所 有 基本 
数据 的 一 份 拷贝 。 计 算 机 可 能 速度 很 快 并 且 有 很 大 的 内 存 ， 但 反复 列 出 客户 是 没有 意义 的 。 

当 某 人 想 成 为 音像 店 的 会 员 时 也 会 产生 问题 。 由 于 他 们 还 没有 租 任何 录像 带 ， 因 而 ， 不 能 
将 他 们 的 个 人 信息 存 入 数据 库 。 相 反 地 ， 当 你 删除 了 所 有 的 旧 数 据 ， 例 如 所 有 去 年 的 租赁 记 
录 时 会 发 生 什 么 ?删除 了 租赁 记录 也 就 删除 了 用 户 数据 。 突 然 闻 ， 你 会 发 现 你 删除 了 一 半 用 
户 的 基本 数据 。 从 技术 的 角度 讲 ， 这 些 问 题 就 是 所 谓 的 插入 异常 和 删除 异常 ! 即 ， 当 数据 存 
储 格式 不 合理 时 ， 添 加 或 删除 数据 时 会 遇 到 困难 。 这 些 问题 之 所 以 会 发 生 ， 是 因为 你 想 将 所 
有 的 数据 存储 到 一 张 表 中 。 

重复 部 分 的 另 一 问题 如 图 3-11 所 示 ， 它 与 COBOL 程 序 员 曾 经 遇 到 过 的 问题 相似 。 在 使 用 
以 前 的 层次 文档 系统 时 ， 数 据 库 设 计 者 必须 为 每 个 重复 部 分 分 配 一 定量 的 空间 。 在 音像 店 例 
子 中 ， 程 序 员 将 会 为 每 张 表单 分 配 出 租 固定 数量 录像 带 的 空间 。 估 算 所 需 的 最 大 空间 是 一 个 
困难 。 问 题 在 于 如 果 一 两 个 客户 要 租 很 多 录像 带 (比如 说 10 盘 或 更 多 )， 程 序 将 永远 为 每 次 租 
赁 分 配 10 盘 录像 带 的 存储 空间 。 而 这 个 空间 在 大 多 数 事 务 中 不 会 用 到 而 浪费 掉 。 另 一 方面 ， 
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RentalForm(TranslD, RentDate, CustomerlD, Phone, Name, Address, City State, ZIPCode, 
(VideolD, Copy#, Title, Rent) ) 


2 在 这 张 原始 表单 中 存储 数据 不 会 很 有 效 。 
例如 ， 重 复 部 分 将 会 引发 问题 。 


2 注意 数据 的 重复 。 


2 另外 ， 如 果 一 位 客户 尚未 租 过 电影 将 会 怎 
样 一 一 在 哪里 存储 这 位 客户 的 数据 ? 





图 3-10 重复 数据 的 问题 。 将 重复 数据 与 主 表单 存储 在 一 起 ， 造 成 重复 部 分 的 每 条 记录 
都 要 复制 基本 数据 。 在 此 例 中 ， 每 盘 录 像 带 租 出 时 都 必须 输入 客户 数据 一 一 其 
至 是 那些 同时 租 出 的 


? UE 
* 分 配 


- es 
+ 不 能 太 少 


+ 浪费 的 空间 
% 例如 ， 一 次 会 租 出 多 少 录像 带 
9 一 个 更 好 的 定义 能 解决 这 个 问题 





不 满足 第 一 范式 


”图 3-11 重复 数据 的 分 配 空间 问题 。 将 重复 数据 以 层次 格式 存储 一 般 强 迫 设计 
者 为 每 条 重复 记录 分 配 固定 数量 的 空间 。 没 有 确定 将 会 需要 多 少 空间 
的 好 办 法 ， 因 此 数据 库 会 有 很 多 未 使 用 的 空间 
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不 能 留 出 足够 大 的 空间 将 会 引发 问题 ， 使 最 好 的 客户 失望 。 再 次 考虑 电话 号 码 的 问题 。 如 果 
不 把 它们 当成 重复 数据 ， 那 么 需要 多 少 列 来 存放 不 同 的 电话 号 码 ， 又 怎么 能 确定 它 够 用 ? 通 
过 将 重复 数据 移 到 单独 的 表 ， 每 个 条 目 占 一 行 ， 不 必 猜 测 需 要 多 少 行 。 当 需要 的 时 候 ， 数 据 
库 会 直接 分 配 新 的 一 行 。 


3.5 第 一 范式 


重复 部 分 问题 的 解决 方法 是 将 它们 放 到 一 个 单独 的 表 中 。 当 一 个 表 没 有 重复 组 ， 就 称 为 满 
足 第 一 范式 。 即 ， 表 中 的 每 一 个 单元 〈 由 一 行 和 一 列 确定 ) 只 能 有 一 个 值 。 这 个 值 应 当 是 原 
子 的 ， 意 思 是 它 不 能 分 解 为 更 小 的 部 分 。 


3.5.1 重复 组 


在 前 面 的 一 些 例子 中 可 以 看 到 ， 有 些 重复 组 是 显而易见 的 。 而 另外 一 些 则 很 微妙 ， 需 要 决 
定 是 不 是 将 它们 划分 进 单独 的 表 更 加 困难 。 第 一 范式 的 规则 很 清楚 : 如 果 一 个 组 的 项 是 重复 
的 ， 那 么 应 该 将 其 划分 到 一 个 新 的 表 中 。 问 题 是 ， 在 一 种 情形 下 重复 的 项 可 能 不 适用 于 另 一 
种 情形 。 考 虑 电话 号 码 的 例子 。 在 很 多 情况 下 ， 你 可 以 简单 地 在 客户 表 中 为 电话 号 码 设置 一 
到 两 列 〈 当 作 不 重复 ) 。 在 另 一 个 情况 下 ， 当 有 大 量 的 客户 并 且 电 话 号 码 集 有 很 多 种 可 能 时 ， 
最 好 的 解决 办 法 是 将 电话 码 号 划分 到 一 个 新 表 中 。 

回 到 音像 店 的 例子 ， 如 图 3-12 所 示 ， 注 意 括 号 中 标 出 的 重复 部 分 。 要 分 割 这 个 表单 ， 首 先 
分 离 出 所 有 不 在 重复 组 中 的 东西 。 这 些 列 以 后 可 能 会 有 其 他 改变 ， 但 它们 不 包含 重复 组 。 其 
次 ， 将 重复 的 录像 带 租赁 部 分 的 所 有 列 放 到 一 个 新 表 中 。 但 是 ， 要 小 心 。 当 你 移出 一 个 重复 
部 分 时 ， 必 须 将 原始 表 的 主 码 也 带 上 。RentalForm 表 具有 TransID 作 为 主 码 。 这 个 主 码 ， 连 同 
VideoID 主 码 必须 成 为 新 表 RentalLine 的 一 部 分 。 你 需要 将 TransID 作 为 主 码 ， 这 样 两 个 表 中 的 
数据 以 后 才能 合并 到 一 起 。 注 意 ， 新 表 (RentalLine) 总 是 会 有 复合 码 一 -用 来 标记 租赁 和 录 
像 带 之 间 的 多 对 多 关系 。 


RentalForm2(TranslD, RentDate， CustomeiiD; one; Name, Address, City, State, ZIPCode) 


i ~ 
Wi ~ 


~ 到 
RentalLine(TransID, VideolD, Copy#, Title, Rent) 


2 去 除 重复 部 分 
* 划分 到 两 个 表 中 
* 从 主要 部 分 和 重复 部 分 获得 主 码 
2 去 除 重复 部 分 
4 每 个 事务 可 以 有 很 多 录像 带 (设置 VideoID 为 主 码 ) 
4 每 盘 录 像 带 可 以 在 多 个 事务 中 出 租 (设置 TransID 为 主 码 ) 
e 每 个 TransID 和 VideoID 只 能 有 一 个 Copy 招 不 用 设置 Copy# 为 主 码 ) 





图 3-12 第 一 范式 。 所 有 重复 组 必须 划分 到 新 表 中 。 确 保 新 表 包 含 原始 表 主 码 的 一 
份 拷贝 。 存 储 重复 组 的 表 必 须 具有 一 个 连接 码 ， 以 便 查询 时 数据 可 以 合并 
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将 重复 组 分 开 解 决 了 很 多 基本 问题 。 首 先 ， 减少 了 重复 : 不 必 再 为 租 出 的 每 盘 录 像 带 输入 
用 户 数据 。 另 外 ， 不 必 担 心 分 配 存 储 空 间 : 每 盘 租 出 的 录像 带 将 存放 在 一 个 新 行 中 。 通 过 将 
所 有 客户 的 租赁 数据 存放 在 一 张 表 中 ， 避 免 了 为 每 个 客户 分 配 空 间 的 问题 。 

很 多 表单 会 有 多 个 不 同 的 重复 组 。 如 图 3-13 所 示 ， 如 果 它 们 的 重复 相互 独立 ， 那 么 划 
分 是 很 直接 的 ， 每 个 重复 组 变 成 一 张 新 表 。 只 需 小 心地 将 原始 表 的 主 码 包含 进 每 张 新 表 中 ， 
以 便 这 些 表 将 来 可 以 相互 连接 到 一 起 。 使 用 基本 的 标记 ， 只 要 括号 不 重合 ， 这 些 组 就 是 相 
互 独立 的 。 例 如 ， 对 于 一 个 更 复杂 的 音像 店 ， 可 能 拥有 租 出 录像 带 的 重复 组 ， 还 可 能 有 一 
个 单独 的 部 分 列 出 某 个 客户 的 家 庭 成 员 。 家 庭 成 员 的 列表 与 租 出 的 录像 带 的 列表 应 当 分 别 
存储 。 


~ 


一 
一 





MainTable(Keyt. , SimpleColumans) 





Y 、 
Group TKay]1, Groun1, A, B, C} Group2(Rev!, Group2, X, Y) 





| 


图 3-13 独立 的 组 。 在 此 例 中 ， 两 个 组 相互 独立 地 重复 。 它 们 各 自 划分 到 新 表 
中 。 记 住 在 每 张 新 表 中 包含 主 码 (Key1)。 


3.5.2 手套 重复 组 


当 一 个 表 中 出 现 许多 不 同 的 重复 组 ， 尤 其 一 个 重复 组 修 套 在 另 一 个 之 中 时 ， 会 产生 更 加 复 
杂 的 情形 。 最 困难 之 处 在 于 确认 修 套 组 的 性 质 。 如 图 3-14 所 示 ， 在 你 确定 关系 之 后 ， 对 表 进 行 
划分 是 很 直接 的 。 只 需 一 次 进行 一 步 ， 首 先 移出 最 外 面 的 组 。 永 远 要 记 住 当 你 划分 每 斐 表 时 
带 上 主 码 。 因 此 当 你 从 第 一 个 组 (Key1…) 中 移出 第 二 个 组 (Key2… (Key3…)) 时 ， 新 表 
TableA 必 须 包含 Key1 和 Key2。 当 你 从 TableA 中 移出 Table3 时 ， 你 必须 连带 前 面 的 主 码 (Key1 
和 Key2) ， 并 添加 第 三 个 主 码 (Key3)。 

一 家 更 复杂 的 音像 店 将 遇 到 人 岁 套 重复 组 的 情况 。 例如 , 这 家 店 可 能 向 商业 客户 出 租 录像 带 ， 
而 客户 内 部 的 多 个 部 门 可 能 同时 租 录 像 带 。 在 这 种 情况 下 ， 租 赁 表单 将 有 一 个 重复 部 分 表示 
部 门 (或 家 庭 成 员 )。 然 后 ， 嵌 大, 的 重复 部 分 为 每 个 部 门 列 出 了 该 部 门 租 的 录像 带 。 例 如 
Department (DepartmentID, :… (VideoID ，…) ) 。 


3.6 第 二 范式 


满足 第 一 范式 的 要 求 很 简单 ， 只 需 确定 重复 组 ， 将 它们 放 到 自己 的 表 中 ， 并 通过 初始 主 码 
与 主 表 相 连接 。 下 一 步 稍微 有 一 点 复杂 ， 因 为 你 需要 检查 表 中 主 码 值 和 其 他 列 ( 非 主 码 ) 之 
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3 
Table2(Keyi, Key2 . . .) Table3(Key1, Key2, Kev3, . . .) 


2 供 套 的 : Table (Key1, aaa. . . (Key2, bbb. . . (Key3, cce. . . 
NA Key2 (Key3, ccc. . .) ) ) 


+ Table1(Key1, aaa. . .) 
+ Table2(Key1, Key2, bbb. . 
+ Table3(Key1, Key2, Key3, ¢ 





图 3-14 九 套 重复 组 。 组 是 符 套 的 ， 当 它们 在 另 一 个 组 之 中 (Key3 在 Key2 中 ，Key2 在 Keyl 中 ) 。 
按 步骤 划分 它们 : 从 group1 中 移出 所 有 group2， 然 后 从 group2 中 移出 所 有 group3。 注 意 ， 
每 张 表 将 包含 原始 码 (Key1)。 由 于 有 三 层 ， 最 终 的 表 (Table3) 必须 包含 三 个 码 列 


间 的 关系 。 正 确 地 指定 主 码 是 至 关 重 要 的 。 此 时 ， 应 当 双 重 检查 所 有 主 码 以 确保 它们 惟一 并 
能 正确 地 表示 多 对 多 的 关系 。 


3.6.1 第 一 范式 的 问题 


在 图 3-12 中 ， 从 表 的 名 称 你 可 以 猜测 第 一 范式 在 有 效 存 储 数据 方面 可 能 仍 存在 问题 。 考 虚 
图 3-15 所 示 的 情形 ， 它 描述 了 当前 的 VideoRental 表 。 每 当 有 人 租 6 号 录像 带 时 ， 数 据 库 都 会 存 


9 1NF 划 分 重复 
Q seemm 
人 Py 





图 3-15 第 一 范式 的 问题 。 不 存在 重复 组 ， 但 VideoRental 表 仍然 包含 重复 数据 。 每 当 一 盘 录 像 带 
被 租 出 ， 我 们 必须 重新 输入 它 的 标题 。 而 且 ， 如 果 一 盘 录 像 带 尚未 被 出 租 ， 那 么 它 的 标 
题 是 什么 ?问题 出 在 标题 只 依赖 于 VideoID， 而 不 依赖 于 TransID 
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储 标题 Clockwork Orange。 问 题 是 ， 电 影 标 题 只 依赖 于 一 部 分 主 码 (VideoID)。 如 果 你 知道 
VideoID ， 就 会 知道 相应 的 标题 。 电 影 标题 不 随 事务 而 发 生 改变 。 除 了 浪费 空间 以 外 ， 还 有 另 
一 个 问题 ， 如 果 一 盘 录 像 带 尚 未 被 出 租 ， 它 的 标题 是 什么 ?因为 电影 只 随 事 务 输入 到 数据 库 
中 ,标题 的 数据 不 会 单独 存储 。 类 似 地 ， 如 果 所 有 租 8 号 录像 带 的 行 都 被 删除 了 ， 你 将 失去 所 
有 与 那 部 电影 相关 的 信息 。 


3.6.2 第 二 范式 的 定义 


前 面 那 个 例子 的 问题 在 于 一 旦 你 知道 了 VideoID， 你 就 能 知道 那 部 电影 的 标题 。 在 
VideoID 和 Title 存 在 一 对 一 的 关系 (也 可 能 是 多 对 一 )。 如 图 3-16 所 示 ， 重点 在 于 它 与 事务 无 关 。 
如 果菜 人 在 六 月 份 租 6 号 录像 带 ， 它 的 标题 是 Clockwork Orange。 如 果 某 人 在 十 二 月 租 该 录像 
带 ， 它 的 标题 仍然 是 Clockwork Orange。 这 样 ， 标 题 只 由 主 码 的 一 部 分 决定 (VideoID 而 非 
TransID)。 如 果 一 张 表 的 每 个 非 主 码 列 都 依赖 于 整个 主 码 (而 非 主 码 的 一 部 分 ) ， 则 称 此 表 满 
足 第 二 范式 (2NF)。 注 意 ， 这 个 问题 只 针对 复合 码 (具有 多 列 )。 


Depends on both TransiD and VideolD 














RentalLine(TransiD, VideolD, Copy#, Title, Rent) 
+ | 
Depend on VideolD only 
0 每 个 非 主 码 列 必须 依赖 于 整个 主 码 。 人 依赖 (定义 ) 
4 只 适用 于 连接 码 。 9 如 果 已 知 主 码 的 值 ， 你 总 能 获 
4 有些 列 只 依赖 于 部 分 主 码 。 得 当前 讨论 的 属性 的 值 ， 那 么 
4 将 那些 列 划分 到 新 表 中 。 就 称 那个 属性 依赖 于 主 码 。 


4 如 果 你 改变 部 分 主 码 ， 但 当前 
讨论 的 属性 值 不 变 ， 那 么 此 表 
不 满足 2NF。 


| 
图 3-16 第 二 范式 的 定义 。 每 个 非 主 码 列 必须 依赖 于 整个 主 码 。 它 只 是 连接 码 
的 问题 。 解 决 方法 是 将 只 依赖 于 部 分 主 码 的 那 部 分 划分 出 来 

解决 办 法 是 划分 表 。 将 只 依赖 于 部 分 主 码 的 列 移出 。 记 住 在 新 表 中 要 包含 那 部 分 主 码 列 。 
新 表 (VideosRented 和 Videos) 如 图 3-17 所 示 。 注 意 ，VideoID 必 须 在 两 个 表 中 都 有 。 它 在 
VideosRented 表 中 表明 每 个 人 租 了 那些 电影 。 它 在 Video 表 中 作为 主 码 是 因为 它 是 惟一 的 标识 
符 。 在 两 张 表 中 包含 此 列 使 我 们 以 后 能 将 数据 连接 到 一 起 。 

在 创建 新 的 Video 表 时 ， 遇 到 一 个 有 趣 的 问题 ， 在 哪里 存放 租金 价格 ?有 两 种 选择 ， 放 
在 VideosRented 表 中 或 放 在 Video 表 中 。 答 案 取决 于 业务 中 的 操作 和 规则 。 从 技术 上 说 ， 存 
在 哪 张 表 中 都 可 以 。 然 而 ， 从 业务 的 角度 看 有 很 大 的 区 别 。 考 虑 将 租金 放 到 Videos 表 中 的 情 
况 。 这 种 模型 表明 只 要 你 知道 VideoID ， 你 就 能 知道 租金 。 换 名 话说， 租金 对 于 每 部 电影 是 
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固定 的 。 例 如 ， 新 发 布 的 电影 可 能 会 有 更 高 的 租金 。 现 在 来 考虑 租金 存储 在 VideosRented 
表 的 情况 。 这 很 明显 地 说 明 租金 依赖 于 VideoID 和 特定 的 事务 。 换 名 话说， 对 于 某 位 客户 ， 
Clockwork Orange 的 租金 可 能 是 2.00 美 金 ， 然 而 另 一 位 客户 可 能 只 需 支 付 1.50 美 金 。 价 格 不 
同 是 因为 对 租 过 很 多 电影 的 人 给 他 打折 ， 或 者 音像 店 每 天 的 价格 不 同 。 大 部 分 商业 数据 库 的 
设计 者 都 很 快 遇 到 哪里 存放 价格 的 问题 。 一 种 解决 方案 是 将 价格 存储 到 两 张 表 中 。 即 ， 存 储 
在 Video (产品 ) 表 中 的 价格 是 标价 。 存 储 在 VideosRented 表 中 的 价格 是 经 过 打折 后 实际 应 
支付 的 租金 。 关 键 在 于 最 终 决定 不 只 依赖 于 机 械 的 规则 ， 也 有 业务 流程 的 因素 。 对 业务 流 
程 的 假设 决定 了 你 得 到 的 表 。 现 在 ， 你 可 以 保持 简单 一 点 的 假设 ， 为 每 盘 录 像 带 赋予 固定 
的 价格 。 






RentalLine(TransiD, VideolD, Copy#, Titie, Rent) 








VideosRented(TransID, VideolD, Copy#) 





Videos(VideolD, Title, Rent) 













2 标题 只 依赖 于 VideoID 
4 每 个 VideoID 只 能 有 一 个 标题 

9 租金 依赖 于 VideoID 

这 条 陈述 实际 上 是 一 条 业务 规则 

4 不 同 商店 规则 可 能 不 同 

有 些 商店 可 能 根据 租赁 日 期 (或 时 间 ) 收取 不 同 的 


金 
2 每 个 非 主 码 列 依赖 于 整个 主 码 









图 3-17 创建 第 二 范式 。 划 分 原始 表 使 得 只 依赖 于 部 分 主 码 的 项 移 到 一 张 单独 
的 表 中 。 注 意 ， 两 张 表 都 必须 包含 VideoID 主 码 


图 3-18 给 出 了 新 表 的 示例 数据 。 注 意 ，2NF 解 决 了 每 次 租赁 重复 记录 电影 标题 的 问题 。 电 
影 的 基本 数据 只 在 Videos 表 中 存储 一 次 。 它 在 VideosRented 表 中 通过 VideoID 列 引用 。 浏 览 
VideosRented 表 时 ， 通 过 在 Videos 表 中 查找 对 应 的 ID ， 可 以 很 容易 获得 相应 的 电影 标题 。 第 4 
章 将 介绍 数据 库 查询 系统 如 何 自 动 处 理 这 种 连接 。 


3.6.3 依赖 


在 讨论 2NF (和 3NF) 的 时 候 使 用 术语 依赖 。 即 ， 属 性 Y 依 赖 于 属性 X 当 且 仅 当 每 个 X 值 能 
惟一 确定 一 个 Y 值 。 在 音像 店 的 例子 中 ， 如 果 知 道 VideoID (6) ， 就 只 有 一 个 对 应 的 电影 标题 
(Clockwork Orange) 。 类 似 地 ， 如 果 有 一 个 CustomerID (3)， 也 只 有 一 个 LastName 
(Washington ) 。 

2NEF 从 指出 如 果 TransID 改 变 电 影 标题 仍 保持 不 变 开 始 引出 讨论 。 由 此 ， 电 影 标 题 不 依 
赖 于 TransID 。 这 种 依赖 (或 不 依赖 ) 对 于 大 部 分 学 生来 说 是 很 困难 的 。 一 旦 你 了 解数 据 间 
的 关系 ,规范 化 是 自然 而 然 的 。 问 题 在 于 在 现实 生活 中 确定 那些 关系 。 依 赖 是 关于 业务 假设 
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和 流程 的 问题 。 当 你 写 出 最 终 的 规范 化 表 (3NF 或 更 高 ) 时 ， 你 已 经 能 明确 地 陈述 那些 业务 
关系 。 
VideosRented(TransiD, VideolD, Copy#) 





Videos(VideolD, Title, Rent) 





(未 改变 ) 
RentalForm2(TransiD, RentDate, CustomerlD, Phone, Name, Address, City, State, ZiPCode) 


图 3-18 第 二 范式 数据 。 电 影 标题 现在 只 存储 一 次 。 其 他 表 (VideosRented) 
可 以 只 通过 主 码 (VideoID) 引用 一 部 电影 ， 这 个 主 码 提供 到 Videos 表 
的 连接 。 注 意 ，RentalForm2 表 自动 满足 2NF， 因 为 它 不 包含 连接 码 
实际 上 ， 通 常 可 以 要 求 客户 阐明 属性 之 间 的 关系 。 但 是 ， 应 该 避免 使 用 术语 ， 诸 如 一 对 一 
和 依赖 。 而 是 应 当 像 这 样 提问 ， 每 一 项 能 不 能 对 应 有 多 个 条 目 ? 或 者 ,不同 的 客户 ， 收 费 会 
不 同 吗 ? 然 而 ， 作 为 一 个 数据 库 设计 者 ， 你 会 发 现 你 很 少 有 时 间 向 客户 询问 所 有 你 想 问 的 问 
题 。 你 自己 尽量 确定 一 般 的 关系 ， 将 那些 困难 的 问题 留 给 客户 。 很 多 商业 问题 具有 相似 的 规 
则 和 假设 。 经 验 可 以 节约 你 的 时 间 ， 因 为 你 不 必要 求 用 户 说 清楚 每 一 条 规则 。 


3.7 第 三 范式 


设计 第 三 范式 (3NF) 用 到 的 逻辑 、 分 析 和 元 素 与 获取 2NF 相 似 。 特 别 地 ， 你 仍然 要 关注 
依赖 的 问题 。 大 部 分 有 经 验 的 设计 者 将 推导 2NF 和 3NF 合 并 为 一 步 。 在 技术 上 ， 满 足 3NF 的 表 
必须 满足 2NF。 


3.7.1 第 二 范式 的 问题 


这 里 ， 你 需要 察看 RentalForm2 表 ， 它 在 前 面 的 分 析 中 一 直 被 忽略 。 如 图 3-19 所 示 。 特 别 
要 注意 ，TransID 是 主 码 。 通 过 示例 数据 可 以 看 出 问题 。 每 当 一 个 客户 租 一 盘 录 像 带 ， 数 据 库 
都 再 次 记录 他 或 她 的 姓名 、 地 址 和 电话 号 码 。 这 些 不 必要 的 重复 既 浪费 空间 ， 也 可 能 浪费 职 
员 录 入 数据 的 时 间 。 考 虑 当 一 个 客户 迁居 会 发 生 什么 。 对 该 客户 的 每 笔 事务 ， 你 都 不 得 不 查 
找 并 更 新 地 址 。 

如 果 客 户 尚未 租 任何 电影 ， 就 没有 地 方 存储 客户 的 数据 。 类 似 地 ， 如 果 从 数据 库 中 删除 以 
前 的 事务 ， 可 能 会 丢失 客户 数据 。 再 一 次 ， 你 不 得 不 处 理 隐 含 依赖 。 
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RentalForm2(TransiD, RentDate, CustomerlD, Phone, Name, Address, City, State, ZIPCode) 








尽管 满足 2NF， 仍 然 有 问题 : 
令 重复 
9 隐 含 依赖 
令 如 果 一 位 客户 尚未 租借 录像 带 ， 我 们 在 哪里 存 
储 客户 的 个 人 数据 呢 
解决 方法 : 划分 表 


图 3-19 第 二 范式 的 问题 。 客 户 数 据 中 的 隐 含 依赖 导致 客户 每 次 从 音像 店 租 录 
像 带 时 都 会 复制 客户 的 地 址 。 类 似 地 ， 如 果 删 除了 旧事 务 数据 行 ， 公 
司 可 能 会 丢失 一 些 客户 的 所 有 数据 


3.7.2 第 三 范式 的 定义 


问题 在 前 一 节 中 已 经 阐述 清楚 。 客 户 的 姓名 、 地 址 、 电 话 号 码 等 等 依赖 于 CustomerID。 
而 CustomerID 并 不 构成 表 的 主 码 的 一 部 分 。 换 句 话 说， 有 些 非 主 码 列 不 依赖 于 主 码 。 那 么 他 
们 为 什么 在 这 张 表 中 ? 问题 同样 也 是 答案 。 如 果 列 不 依赖 于 主 码 ， 那 么 他 们 应 当 放 在 不 同 的 
表 中 。 

一 张 表 要 满足 3NF， 他 必须 首先 满足 2NF， 并 且 每 个 非 主 码 列 必须 只 依赖 于 主 码 。 在 图 
3-20 所 示 的 音像 店 例子 中 ， 问 题 出 在 基本 客户 数据 列 依赖 于 CustomerID ， 而 它 并 不 是 主 码 的 
一 部 分 。 


Depend on TranslD 


RentalForm2(TranslD, RentDate, CustomerlD, Phone, Name, Address, City, State, ZIPCode) 


Depend only on CustomeriD 


每 一 非 主 码 列 必须 依赖 且 仅 依赖 于 主 码 
人 如果 某 一列 所 依赖 的 列 并 非 主 码 的 一 部 分 ， 将 这 些 列 划分 到 新 表 中 去 
令 例 : 客户 的 姓名 不 随 每 个 事务 而 变化 
图 3-20 第 三 范式 定义 。 这 张 表 不 满足 3NF， 因 为 有 些 列 依赖 于 CustomerID， 
而 后 者 不 是 主 码 的 一 部 分 a 
和 车 一 看 ， 似 乎 有 两 种 可 行 方 案 : (1) 将 CustomerID 作 为 部 分 主 码 ，(2) 划分 表 。 如 果 表 
已 经 满足 2NF， 那 么 只 有 (2) 是 可 行 的 。 第 一 种 方案 存在 的 问题 是 ， 将 CustomerID 作 为 主 码 
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的 一 部 分 等 价 于 说 每 个 事务 可 以 包括 多 个 客户 。 这 个 假设 似乎 并 不 成 立 。 然 而 ， 即 便 假设 成 
立 ， 你 的 表 也 将 不 再 满足 2NF， 因 为 客户 数据 只 依赖 于 主 码 的 一 部 分 (CustomerID 而 非 
TransID)。 这 样 ， 正 确 的 解决 方案 是 将 表 分 为 两 部 分 : 依赖 于 整个 主 码 的 列 和 依赖 于 其 他 
(CustomerID) 的 列 。 

对 于 音像 店 示例 ， 解 决 办 法 是 将 依赖 于 CustomerID 的 列 移出 。 记 住 ， 一 定 要 在 两 个 表 中 
都 包含 CustomerID 列 ， 以 便 它们 以 后 可 以 重新 连接 起 来 。 结 果 表 如 图 3-21 所 示 。 注 意 ， 
CustomerID 列 不 是 Rentals 表 的 主 码 。 表 可 以 通过 列 进 行 连接 ， 即 使 这 些 列 不 是 主 码 的 一 部 分 。 
图 3-21 还 描述 了 如 何 划分 表 以 解决 隐 含 依赖 的 问题 。 


RentalForm2(TransID, RentDate, CustomerlD, Phone, Name, Address, City, State, ZIPCode) 





Rentals(TransID, RentDate, CustomerlD ) 








Customers(CustomerlD, Phone, Name, Address, City, State, ZIPCode) 








图 3-21 第 三 范式 。 将 客户 数据 放 入 单独 的 表 中 ， 消 除 隐 含 依赖 并 解决 数据 重复 的 
问题 。 注 意 ，CustomerID 在 两 张 表 中 都 存在 ， 但 它 不 是 Rental 表 的 主 码 

最 后 得 到 的 表 集 如 图 3-22 所 示 。 这 个 列表 满足 3NF: 表 中 没有 重复 组 (1NF) ， 每 个 非 主 码 
列 都 依赖 于 所 有 主 码 (2NF) ， 并 且 只 依赖 于 主 码 (3NF)。 这 些 表 显 示 为 标记 表单 和 类 图 格式 。 
类 图 使 用 Microsoft Access 数 据 库 管 理 系统 创建 ， 通 过 公共 列 显 示 这 些 表 如 何 相 互 连 接 。 

敏锐 的 读者 或 许 会 对 地 址 数据 产生 疑问 。 即 ，City、State 和 ZipCode 具 有 某 种 依赖 关系 。 
或 许 Customer 表 并 不 真 的 满足 3NF? 理论 上 讲 ， 确 实 是 这 样 ，ZIP 代 码 用 于 确定 位 置 。 此 处 的 
陷阱 在 于 5 位 数字 的 ZIP 代 码 标准 是 否 够 用 ， 因 此 ， 这 种 关系 非常 弱 。 一 个 ZIP 代 码 确 定 一 个 邮 
局 。 每 个 城市 会 有 很 多 ZIP 代 码 ， 并 且 一 个 ZIP 代 码 可 以 用 于 多 个 城市 。 目 前 ， 一 个 ZIP 代 码 总 
可 以 确定 一 个 州 。 但 是 ， 你 能 确定 这 种 关系 永远 满足 吗 一 一 甚至 在 世界 范围 内 ? 因此， 在 同一 
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个 表 中 包含 所 有 这 三 项 通常 是 可 以 接受 的 。 另 一 方面 ， 正 如 在 第 2 章 宠物 商店 的 讨论 中 所 指出 
的 那样 ， 单 独创 建 一 个 City 表 确实 有 一 些 好 处 。 最 重要 的 好 处 是 ， 通 过 从 预定 义 的 列表 中 选取 
城市 ， 可 以 减少 输入 数据 的 时 间 和 错误 。 


TransiD 
RentalDate 
CustomeriD 





Rentais(TransiD, RentDate, CustomeriD ) 





Cusiomers(CustomeriD, Phone, Name, Address, City, State, ZiPCode ) 





VideosRented(TransiD, VideoiD, Copy#) 
Videos(YideotD, THle, Rent) 


图 3-22 第 三 范式 表 。 表 中 没有 重复 组 ， 而 且 每 个 非 主 码 列 依赖 且 仅 依赖 于 整个 主 码 


。 3.7.3 检查 你 的 工作 


在 此 关键 点 上 ,你 必须 双重 检查 你 的 工作 。 在 大 型 项 目 中 , 应 当 让 若干 团队 成 员 参 与 校 验 ， 
以 确保 定义 数据 表 所 用 的 假设 符合 业务 流程 。 

数据 规范 化 的 本 质 是 收集 所 有 表单 和 报表 ， 然 后 检查 每 张 表单 ， 确 定 将 要 存储 的 数据 。 以 
标准 符号 书写 列 能 使 规范 化 过 程 更 直接 ， 将 出 错 的 可 能 性 最 小 化 。 特 别 地 ， 要 注意 查找 主 码 
并 突出 一 对 一 和 一 对 多 的 关系 。 检 查 工作 时 ， 需 要 查看 每 张 表 ， 确 保 它 正确 描述 了 假设 和 公 
司 的 流程 。 

检查 表 基 本 上 是 重复 规范 化 中 的 步 允 。 首 先 ， 确 保 将 所 有 的 重复 组 移出 。 当 进行 这 一 步 时 ， 
你 应 当 双 重 检查 主 码 。 从 表 中 第 一 个 主 码 列 开始 ， 询 问 自己 该 列 与 其 他 每 列 是 否 存在 一 对 一 
或 者 一 对 多 的 关系 。 如 果 存 在 一 对 多 (或 多 对 多 ) 的 关系 ， 需 要 把 该 列 的 标题 加 上 下 划 线 。 
如 果 是 一 对 一 (或 多 对 一 ) 的 关系 ， 那 么 此 列 就 不 应 当 加 下 划 线 。 第 二 步 是 检查 每 个 非 主 码 
列 ， 询 问 自己 它 是 不 是 依赖 于 并 且 仅 依赖 于 整个 主 码 。 第 三 ， 确 认 表 可 以 重新 连接 起 来 。 试 
着 在 表 与 表 之 间 连 线 。 不 与 其 他 任何 表 相 连 的 表 很 可 能 是 错误 的 。 第 四 ， 问 问 自己 是 否 每 张 
表 表 示 了 一 个 单独 的 对 象 。 试 着 给 它 起 个 名 称 。 如 果 你 找 不 到 一 个 合适 的 单独 的 名 字 来 命名 
一 张 表 ， 那 么 这 张 表 很 可 能 代表 了 多 个 对 象 ， 需 要 进行 划分 。 最 后 ， 给 每 张 表 输入 示例 数据 ， 
保证 没有 重复 的 行 。 当 你 开始 输入 数据 的 时 候 ， 一 些 带 在 的 问题 可 能 就 变 得 明显 起 来 。 最 好 
在 设计 阶段 输入 测试 数据 ， 而 不 要 等 到 最 后 实现 才 输 入 。 
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3.8 超越 第 三 范式 


在 关系 数据 库 设计 理论 中 ，E. F. Codd 首 先 提出 了 这 三 种 范式 的 规则 。 在 观察 现实 世界 的 
情况 中 ， 他 和 其 他 作者 认识 到 在 某 些 情形 下 可 能 产生 另外 的 问题 。 特 别 地 ，Codd 最 初 的 3NF 
定义 可 能 范围 太 窗 了 。 因 此 ， 他 和 Boyce 定 义 了 一 个 新 的 版 本 ， 称 为 Boyce-Codd 范 式 
(BCNE ) 。 

其 他 作者 最 终 确 定 了 可 能 产生 的 新 闻 题 ， 并 进而 创建 了 “范式 ”。 幸 运 的 是 ， 这 些 情 况 在 
实际 中 并 不 常见 。 如 果 你 在 设计 数据 库 时 很 仔细 ， 尤 其 是 创建 主 码 时 ， 你 就 不 会 遇 到 太 多 问 
题 。 但 是 ， 问 题 会 偶尔 出 现 ， 因 此 一 个 优秀 的 数据 库 设计 者 会 检查 下 面 各 节 中 描述 的 问题 。 
有 许多 设计 人 员 的 大 型 项 目 ， 团 队 中 的 每 一 个 成 员 应 当 检 查 最 终 的 表 。 


3.8.1 Boyce-Codd 范 式 


你 已 经 看 到 当 表 中 存在 隐 含 依赖 时 间 题 会 如 何 产生 。 表 中 列 之 闻 的 次 要 关系 能 引起 重复 和 
数据 丢失 的 问题 。 考 虑 图 3-23 所 示 的 例子 ， 它 包含 雇员 的 数据 。 从 业务 规则 可 知 ， 这 张 表 满足 
3NF。 主 码 是 正确 的 ， 并 且 根据 规则 (ec) ， 非 主 码 列 (Manager) 依赖 于 整个 主 码 。 即 ， 对 于 
每 个 雇员 的 每 个 专业 ， 可 以 有 一 位 不 同 的 经 理 。 问 题 的 产生 是 由 于 规则 (d) : 每 位 经 理 只 能 
有 一 个 专业 。 经 理 可 以 确定 专业 ,但 经 理 不 是 表 的 主 码 ， 表 中 有 一 个 隐 含 依赖 (Manager 一 
Specialty) 。 当 你 删除 旧 数 据 行 ， 将 某 个 经 理 的 引用 全 删除 了 会 怎样 呢 ? 你 就 会 失去 表示 那 位 
经 理 专业 的 数据 。BCNF 通 过 规定 任何 依赖 必须 显 式 地 以 主 码 表 示 ， 避 免 了 这 个 问题 。 










Employee-Specialty(E#, Speclalty Manager) 
业务 规则 ， d 
a. 雇员 可 以 有 很 多 专业 
b. 每 个 专业 有 很 多 经 理 
c. 雇员 的 每 个 专业 只 能 有 一 位 经 理 
d, 每 位 经 理 只 有 一 个 专业 


可 能 的 解决 方法 ， 
Emplioyee(E#, Manager) Empiloyee(E#, Speciaity, Manager) 









Manager(Manager, Specialty) Manager(Manager, Specialty) 





图 3-23 Boyce-Codd 范 式 。 经 理 和 专业 之 间 有 一 个 隐 含 依赖 〈d) 。 如 果 我 们 从 原始 表 中 删 
除数 据 行 ， 那 可 能 会 丢失 有 关 经 理 的 数据 。 解 决 方法 是 添加 一 张 表 来 使 隐 含 显 式 
化 。 从 灵活 角度 考虑 ， 保 留 原 始 的 表 可 能 更 好 一 些 一 一 以 防 假设 发 生变 化 


解决 方法 是 添加 一 张 表 ， 使 这 种 依赖 显示 出 来 。 因 为 每 个 专业 可 以 有 很 多 经 理 ， 因 此 最 好 
的 解决 方案 是 添加 一 张 表 Manager (Manager，Specialty ) 。 注 意 ， 技 术 上 你 现在 可 以 将 
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Specialty 列 (连同 主 码 Manager) 从 原 表 中 移出 。 因 为 一 位 经 理 只 能 有 一 个 专业 ， 只 要 你 知道 
经 理 ， 你 就 能 通过 连接 获得 专业 。 然 而 ， 如 果 你 在 原始 表 中 保留 三 列 ， 数 据 库 会 更 加 灵活 ， 
尽管 它 会 产生 一 些 重复 数据 。 原 因 是 ， 这 个 问题 的 产生 是 基于 一 些 不 寻常 的 假设 。 如 果 这 些 
假设 发 生 改 变 ， 就 要 修改 表 。 在 此 例 中 ， 公 司 的 经 理 只 能 拥有 一 个 专业 并 不 很 现实 。 最 好 是 
保留 原始 表 ， 并 添加 新 的 Manager 表 。 如 果 假 设 发 生 改 变 ， 只 需 将 Specialty 作 为 Manager 表 的 
一 个 主 码 即 可 。 重 点 在 于 你 已 经 显 式 地 表示 了 隐 含 关系 ， 因 此 ， 不 必 再 担心 删除 数据 时 会 丢 
失重 要 的 关系 。 


3.8.2 第 四 范式 


当 存 在 两 个 二 元 关系 ， 建 模 人 员 试 图 将 它们 表示 为 一 个 合并 的 关系 时 ， 会 引起 第 四 范式 
(4NF) 的 问题 。 一 个 例子 应 当 能 说 明 这 种 情况 。 

图 3-24 中 , 雇员 可 以 有 很 多 专业 , 每 种 专业 都 可 以 完成 很 多 任务 。 由 于 所 有 三 列 都 是 主 码 ， 
这 张 表 一 定 满足 3NF。 根 据 业 务 规则 ， 你 可 以 看 到 主 码 是 合理 的 。 然 而 ， 这 里 实际 上 有 两 个 二 
元 关系 : Employee 一 Specialty 和 Employee 一 Tool， 而 不 是 一 个 三 元 关系 。 


EmployeeTasks(EID, Speciality, TooliD) 
[4 + 


业务 规则 ， 
雇员 有 很 多 专业 
多 每 个 专业 有 很 多 工具 
工具 和 专业 不 相关 


EmployeeSpecialty(EID, Specialty) 
EmplioyeeTools(EID, TooliD) 





图 3-24 第 四 范式 。 原 始 表 满足 3NF， 因 为 不 存在 非 主 码 列 。 主 码 是 合理 的 ， 
但 存在 隐 含 (多 值 ) 依赖 ， 因 为 Specialty 和 ToolID 不 相关 。 解 决 方法 
是 创建 两 张 表 一 一 每 张 表 显示 依赖 的 一 方 
由 于 第 三 条 业务 规则 指明 ，Specialty 和 ToolID 并 不 直接 相互 依赖 ， 因 此 ， 需 要 拆 分 原始 表 
成 两 个 表 以 去 除 隐 仿 依赖。 使 用 原始 的 设计 ， 你 会 遇 到 的 问题 是 ， 如 果 为 每 个 雇员 列 出 其 每 
个 专业 所 用 的 工具 ， 那 么 就 会 存在 客观 的 重复 。 将 专业 和 工具 分 开 列 出 会 更 有 效 。 
第 四 范式 的 问题 在 实际 当中 相对 少见 。 但 是 ， 它 们 仍 会 发 生 并 且 造 成 问题 ， 因 此 ， 你 要 能 
够 发 现 它们 。 主 要 的 技巧 是 寻找 隐 含 依赖 ， 确 保 他 们 变 得 清楚 。 


3.8.3 域 - 码 范式 


1981 年 ，Fagin 提 出 了 一 种 不 同 的 规范 化 表 的 方法 ， 命 名 为 域 一 码 范式 (DKNF)。 它 描述 
设计 数据 库 的 最 终 目标 。Fagin 证 明了 ， 如 果 一 张 表 满 足 DKNF， 那 么 它 一 定 也 满足 4NF，3NF 
以 及 其 他 所 有 范式 。 关 键 是 没有 一 种 特定 的 方法 能 使 一 张 表 转 换 到 满足 DKNF。 事 实 上， 有些 
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表 可 能 永远 无 法 转换 为 满足 DKNF 的 表 。 

尽管 有 这 些 困难 ，DKNF 对 于 应 用 开发 者 仍 是 很 重要 的 ， 因 为 它 是 设计 应 用 的 目标 。 将 它 
想象 成 当 你 没有 精确 方向 时 驾车 去 购物 中 心 。 只 要 你 知道 如 何 开始 (1NF、2NF 和 3NF 都 是 明 
确定 义 的 )， 并 且 当 你 到 达 时 (DKNF) 能 够 辨认 出 购物 中 心 ， 你 仍然 是 可 以 到 达 的 。 

DKNF 的 目标 是 用 每 张 表 表示 一 个 主题 ， 并 将 业务 规则 以 域 约束 和 主 码 关 系 的 形式 表示 。 
即 ， 所 有 业务 规则 明确 地 表示 为 表 的 规则 。 域 约束 是 很 简单 的 ， 它 们 表示 对 一 列 中 数据 的 限 
制 。 例 如 ， 价 格 不 能 为 负数 。 

其 他 所 有 业务 规则 必须 以 主 码 的 形式 表现 为 关系 。 特 别 地 ， 不 能 存在 任何 隐 含 关系 。 考 虐 
图 3-25 所 示 的 例子 ， 它 显示 了 一 张 学 生 和 老师 的 表 。 它 可 能 满足 DKNF， 只 有 在 你 检查 业务 规 
则 之 后 才 会 清楚 。 一 个 典型 大 学 的 规则 是 ， 一 个 学 生 可 以 有 多 个 老师 ， 但 每 个 专业 只 能 有 一 
个 老师 。 此 外 ， 老 师 只 能 是 自己 所 在 学 科 的 老师 。 有 了 这 两 条 规则 ， 上 面 两 张 表 显然 不 满足 
DKNF。 首 先 ， 主 码 SID 可 能 不 惟一 。 其 次 ， 必 须 有 关于 Major 和 Discipline 的 明确 规则 。 图 3-26 
表示 了 满足 DKNF 的 三 个 新 表 。 注 意 ， 现 在 所 有 的 业务 规则 都 明确 地 以 主 码 和 外 码 关 系 的 形式 
表示 。 


Student (SID, Name, Major, Advisor) 
Advisor (FIND, Name, Office, Discipline) 


业务 规则 : 
一 个 学 生 可 以 有 多 位 老师 ， 但 每 个 专业 只 能 有 一 位 老师。 
老师 只 能 是 自己 所 在 学 科 的 老师 。 





图 3-25 DKNF 示 例 。 此 表 不 满足 DKNF。 因 为 一 个 学 生 可 以 有 多 个 专业 ，SID 

不 会 是 惟一 的 主 码 。 另 外 ，Advisor 与 Major 相 关 ， 这 是 一 种 隐 含 关系 
要 定义 一 组 满足 DKNF 的 表 ， 必 须 从 满足 3NF 规 则 开始 。 然 后 确保 有 关于 业务 规则 的 完整 列 
表 。 接 下 来 确保 业务 规则 都 以 域 约束 和 主 码 
关系 的 形式 表示 。 检 查 主 码 以 确保 它们 是 惟 
一 的 ， 并 且 你 找到 了 所 有 的 多 对 多 关系 。 确 
保 没有 任何 隐 含 规则 或 依赖 。 设 置 外 码 关系 
以 加 强 现 有 规则 并 与 其 他 表 中 的 数据 相 匹配 。 et. 
要 了 解 域 一 码 范式 ,返回 到 第 2 章 的 开始 。 Mvisor(SID, 
设计 数据 库 的 目标 是 要 建立 组 织 模型 ， Facaiy(EIG Name, Otfice, Discipiine) 
DKNF 通 过 说 明 最 好 的 数据 库 设计 就 是 能 用 
数据 库 规则 明确 描述 所 有 的 商业 规则 ， 从 而 

澄清 这 一 目标 。 

理论 上 ， 不 会 有 任何 超越 DKNF 的 范式 。 图 3-26 DKNF 解 决 方法 。 划 分 表 使 主 码 惟一 。 早 先 





Maior, FjD) 





这 个 原理 很 不 错 ， 因 为 目前 还 没有 一 种 特定 Major 与 Discipline 之 间 的 隐 含 关系 通过 外 码 
的 方法 能 使 一 组 表 满 足 DKNF， 所 以 它 并 不 约束 变 得 明显 


总 是 很 有 用 。 有 些 作者 指出 了 其 他 潜在 的 问题 ， 推 导出 另外 版 本 的 范式 ， 诸 如 第 五 范式 。 由 
于 这 些 定义 大 部 分 在 实际 中 并 不 非常 有 用 ， 在 这 里 就 不 再 进行 描述 。 你 可 以 参考 C. J. Date 的 
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教材 了 解 更 多 有 关 理 论 概念 的 详细 内 容 和 一 些 示例 。 
3.9 数据 规则 和 完整 性 


当 你 与 用 户 和 经 理 进 行 交 流 ， 设 计 报 表 和 数据 表 时 ， 你 还 要 考虑 需要 强制 执行 哪些 业务 规 
则 。 数 据 库 设计 者 的 目标 之 一 是 保证 数据 的 准确 性 。 很 多 情况 下 业务 规则 是 很 显然 的 。 例 如 ， 
一 般 希 望 保证 价格 要 大 于 零 。 类 似 地 ， 可 能 有 一 条 约束 保证 工资 不 应 当 超 过 诸如 100000 美 元 ， 
或 者 雇用 日 期 不 能 早 于 公司 成 立 的 日 期 。 这 些 数 据 完 整 性 约束 在 大 部 分 数据 库 中 是 很 容易 指 
定 的 。 典 型 地 ， 你 可 以 在 表 的 定义 中 添加 一 条 简单 的 约束 连带 着 一 条 消息 。 将 这 些 约束 与 表 
存储 在 一 起 的 好 处 是 ，DBMS 为 该 表 上 的 每 个 操作 强制 检查 该 条 件 ， 无 论 数 据 源 或 数据 输入 的 
方法 是 什么 。 不 需要 编程 ， 而 且 约 束 存储 在 一 个 位 置 。 如 果 你 需要 修改 条 件 ， 它 很 容易 访问 
(对 于 授权 用 户 )。 

第 二 类 约束 是 从 某 一 组 预定 义 的 选项 中 选取 数据 。 例 如 ， 性 别 可 以 列 为 male 、female 或 未 
知 。 提 供 一 个 列表 辅助 职员 输入 数据 ， 并 且 强 制 他 们 只 输入 提供 的 选项 。 例 如 ， 你 不 必 担 心 
有 人 会 输入 f、F 或 ftm。 数 据 的 一 致 性 更 强 。 

第 三 类 数据 完整 性 更 复杂 一 些 , 但 在 关系 数据 库 中 非常 重要 。 数据 表 依 据 属性 很 好 地 组 织 ， 
确保 有 效 地 存储 数据 。 然 而 ， 你 要 能 将 表 中 的 数据 重新 连接 起 来 ， 以 获得 用 户 需要 的 报表 和 
表单 。 考 虑 图 3-27 所 示 的 音像 店 示例 ， 职 员 向 Rentals 表 输入 一 个 客户 号 。 如 果 职 员 输 入 的 客户 
号 在 Customer 表 中 不 存在 ， 将 会 发 生 什么 ? 在 那 盘 录 像 带 归还 前 ， 你 没有 办 法 找到 那 位 客户 。 
因此 ， 你 需要 一 个 约束 来 保证 当 一 个 客户 号 输入 到 Rentals 表 中 时 ， 那 个 号 码 必须 已 经 在 
Customer 表 中 存在 。Rentals 表 中 的 CustomerID 是 该 表 的 一 个 外 码 ， 你 所 需 的 约束 就 是 所 谓 的 
参照 完整 性 。 参 照 完整 性 指 的 是 ， 只 有 当 一 个 外 码 值 在 原 表 中 存在 时 才能 被 输入 。 















Rental 






© 简单 的 业务 规则 

4 数据 范围 的 限制 
+ Price > 0. 
+ Salary < 100 000 
+ DateHired > 1/12/1995 

@ 从 集合 中 选取 
+ Gender = M, F, Unknown 
+ Jurisdiction=City, County, State, Federal 





No data for this 


customer yet! 
0 参照 完整 性 


4 一 张 表 中 外 码 值 必须 在 主 表 中 存在 
多 C# 必 须 在 Customer 表 中 存在 
4 还 没有 此 客户 的 数据 











Customer 





图 3-27 数据 完整 性 。 数 据 完整 性 可 以 通过 简单 的 规则 来 维护 。 关 系数 据 库 依 
赖 参照 完整 性 约束 来 保证 在 用 户 数据 存在 之 后 用 户 编号 才能 输入 到 
Rental 表 中 
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本 质 上 ， 一旦 定义 了 表 之 间 的 关系 ， 你 可 以 要 求 DBMS 强 制 参 照 完 整 性 。 定 义 参照 完整 性 
的 方法 与 具体 的 DBMS 相 关 。 在 Access 中 ， 使 用 一 种 类 图 建立 和 显示 这 些 关 系 ， 其 中 连接 线段 
表示 参照 完整 性 约束 。 大 多 数 关 系数 据 库 还 支持 级 联 删 除 ， 使 用 了 相同 的 概念 。 如 果 用 户 删 
除了 Customer 表 中 的 一 行 ， 那 么 你 还 需要 删除 Rentals 表 中 相关 的 数据 。 然 后 你 需要 删除 
VideosRented 表 中 的 相应 行 。 如 果 你 建立 了 关系 并 指定 级 联 删除 ， 当 用 户 从 Customer 表 中 删除 
一 条 记录 时 ， 数 据 库 会 自动 删除 相关 的 行 。 通 过 保证 表 之 间 的 连接 总 是 引用 合法 的 行 ， 这 些 
操作 维护 了 数据 库 的 一 致 性 。 

Oracle 和 SQL Server 通 过 在 创建 VideosRented 表 时 声明 外 码 来 提供 对 参照 完整 性 的 支持 。 
图 3-28 显 示 了 可 用 于 创建 带 有 三 列 的 Order 表 的 命令 。 这 家 公司 希望 保证 所 有 的 订单 都 发 往 有 
效 的 客户 ， 因 此 Order 表 中 的 客户 号 (CID) 必须 在 Customer 表 中 存在 。 外 码 约束 强制 了 这 个 
关系 。 这 个 约束 还 指明 ， 此 关系 应 当 处 理 级 联 删 除 。Oracel/ 和 SQL Server 使 用 标准 SQL 语言 创 
建 表 。 


CREATE TABLE Order 
{ OID NUMBER (5) NOT NULL, 
Odate DATE, 
CID NUMBER (5), 
CONSTRAINT pk_Customer 
PRIMARY KEY (OID), 


CONSTRAINT fk_Customer 
FOREIGN KEY {CID) 
REFERENCES Customer (CID) 
ON DELETE CASCADE 





图 3-28 SQL 参照 完整 性 定义 。 在 Order 表 中 ， 将 一 列 声明 为 外 码 会 使 DBMS 检 
查 表 中 的 每 个 值 ， 在 参照 表 (例如 ，Customer) 中 找到 匹配 的 值 

当 你 开始 向 DBMS 输 入 数据 ， 你 很 快 会 发 现 参 照 完 整 性 所 起 的 作用 。 考 虑 两 张 表 : Order 
(OrderID，Odate，CustomerID) 和 Customer (CustomerID ，Name，Address， 等 等 ) 。 你 有 一 
个 参照 完整 性 约束 ， 将 Order 表 中 的 CustomerID 列 和 Customer 表 中 的 CustomerID 列 连接 到 一 起 。 
现在 你 向 两 张 表 输入 示例 数据 ， 但 从 Order 表 开始 。DBMS 不 会 接受 任何 数据 ， 因 为 相应 的 
CustomerID 必 须 首 先 在 Customer 表 中 存在 。 即 ， 参 照 完整 性 规则 强迫 你 按 特 定 顺 序 输 入 数据 。 
很 明显 ， 这 些 规则 会 给 用 户 带 来 问题 ， 因 此 你 不 能 指望 用 户 直 接 向 表 中 输入 数据 。 第 6、7 和 8 
章 将 介绍 如 何 使 表单 和 应 用 程序 自动 保证 用 户 以 适当 的 顺序 输入 数据 。 


3.10 业务 规则 的 影响 


理解 不 同 的 业务 规则 如 何 影 响 数据 库 设计 和 规范 化 过 程 是 十 分 重要 的 。 作 为 数据 库 设计 
者 ， 必 须 确认 基本 规则 并 建立 数据 库 满 足 它们 。 但 需要 小 心 的 是 ， 业 务 规则 可 能 改变 。 如 果 
你 觉得 当前 的 业务 规则 限制 性 太 强 ， 你 就 应 当 为 数据 库 设 计 一 个 更 灵活 的 结构 。 

考 略 图 3-29 所 示 的 例子 。 当 地 的 公园 和 娱乐 部 门 经 营 一 个 足球 俱乐部 ， 在 每 次 比赛 之 后 收 
集 基 本 的 统计 信息 。 你 要 为 这 个 问题 设计 数据 表 。 
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Team 1 
Name 
Sponsor 


Player 
Name 





图 3-29 足球 俱乐部 的 数据 库 设 计 。 设 计 和 规范 化 的 表 依 赖 于 业务 规则 


要 描述 不 同 规则 的 影响 ， 考 虐 两 种 主要 的 规则 及 其 结果 表 ， 如 图 3-30 所 示 。 第 一 条 规则 规 
定 ， 每 场 比赛 只 能 有 一 名 裁判 。 因 此 ，RefID 可 以 放 在 Match 表 中 。 注 意 ， 它 不 是 主 码 的 一 部 
分 。 第 二 条 规则 规定 ， 一 个 运动 员 只 能 为 一 支 球 队 效 力 ， 因 此 ， 适 当 的 TeamID 可 以 放 在 Player 
表 中 。 






每 场 比赛 只 能 有 一 位 裁判 。 一 个 运动 
员 只 能 为 一 支 球 队 效 力 。 








Match(MatchiD, DatePlayed, Location, ReflD) 
Score(MatchiD, TeamtD, Score) 
Referee(ReflD, Phone, Address) 
Team(TeamiD, Name, Sponsor) 
Player(PlayeriD, Name, Phone, DoB, TesmiD} 

PlayerStats(MatchiD, PlayeriD, Points, Penatties) 

















图 3-30 限制 规则 。 每 场 比赛 只 能 有 一 位 裁判 , 裁判 表 的 主 码 添加 到 Match 表 中 、 
类 似 地 ，TeamID 列 放置 在 Player 表 中 


现在 考虑 如 果 这 两 条 规则 不 严格 的 情况 ， 如 图 3-31 所 示 。 人 俱乐部 经 理 认为 某 一 天 每 场 比赛 
可 以 有 多 名 裁判 。 另 外 ， 替 补 球员 产生 了 问题 。 一 名 替补 球员 在 一 个 赛季 中 可 能 为 多 个 球 队 
效力 一 一 但 每 场 比赛 只 属于 一 个 队 。 要 处 理 这 些 新 规则 ， 主 码 值 必须 改变 。 你 可 能 会 进行 图 3- 
31 所 示 的 简单 修改 ， 即 ， 将 RefID 作 为 Match 表 的 部 分 主 码 ， 并 使 TeamID 成 为 Player 表 的 部 分 
主 码 。 现 在 每 场 Match 可 以 有 多 名 Referee， 而 且 每 名 Player 可 以 为 多 个 球 队 效 力 。 这 种 方法 的 
间 题 在 于 ，Match 表 和 Player 表 不 再 满足 3NF。 例 如 ，DatePlayed 不 依赖 RefID。 同 样 ，Player 表 
中 的 Name 不 依赖 于 TeamID 。 例 如 ，Paul Ruiz 在 不 同 球 队 效力 时 他 的 名 字 并 不 变 。 

解决 办 法 如 图 3-32 所 示 。 添 加 一 个 新 表 来 处 理 裁判 和 比赛 之 间 多 对 多 关系 。 类 似 地 ,球员 
的 TeamID 转 移 到 PlayerStats 表 中 ， 但 它 不 是 主 码 的 一 部 分 。 在 这 种 方案 中 ， 每 场 比赛 有 多 名 球 
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员 ， 每 名 球员 可 以 参加 多 场 比赛 。 然 而 ， 对 于 每 场 比赛 ， 每 名 球员 只 能 为 一 支 球 队 效 力 。 这 
种 新 的 数据 库 设计 与 原始 的 设计 不 同 。 更 重要 的 是 ， 它 的 限制 性 更 少 。 作 为 一 个 设计 者 ， 你 
在 设计 数据 库 的 时 候 必须 考虑 到 未 来 ， 以 便 它 能 处 理 部 门 未 来 的 需要 。 


每 场 比赛 可 以 有 多 位 裁判 。 一 个 队员 可 以 在 多 个 球 队 踢 球 (替补 )， 但 
每 场 比赛 只 属于 一 个 队 。 


Match(MatchiP,，Dateplayed，Location，ReflD) 
Score(MatchlD,，TeamlD，score) 


Referee(Reftp，Phone，Address) 

Team(TeamiD, Name, Sponsor) 
Player(PlayeriD, Name, Phone, DoB, Teamib) 
PlayerStats(MatchlD, PlayeriD, Points, Penalties) 





图 3-31 放松 规则 来 允许 多 对 多 的 关系 。 你 可 能 试图 将 RefID 列 和 TeamID 列 作 
为 部 分 主 码 ， 但 结果 表 不 满足 3NF。Location 不 依赖 于 RefID，Player 
Name 不 依赖 于 TeamID 


Match(MatchiD, DatePlayed, Location) 
RefereeMatch(MatchiD, RefIiD) 
Score(MatchID, TeamlD, Score) 
Referee(ReflD, Phone, Address) 


Team(TeamID, Name, Sponsor) 
Player(PlayeriD, Name, Phone, DoB) 
PlayerStats(MatchiD, PlayerlD, TeamID, Points, Penalties) 





图 3-32 放松 规则 与 规范 化 表 。RefereeMatch 表 允许 每 场 比赛 有 多 个 裁判 。 将 
TeamID 移 到 PlayerStats 表 中 表明 某 个 人 可 以 为 多 个 球 队 踢 球 一 一 但 每 
场 比 赛 只 属于 一 个 球 队 
这 些 数 据 库 设 计 哪 个 是 正确 的 ?答案 取决 于 部 门 的 需要 。 在 实际 当中 ， 选 择 那 个 更 灵活 的 
设计 是 比较 明智 的 ， 它 能 为 一 场 比赛 分 配 多 名 裁判 ， 并 允许 运动 员 在 赛季 中 为 多 个 球 队 效 力 。 
但 是 ， 在 实际 当中 ， 你 需要 对 这 个 数据 库 设 计 进行 一 些小 改动 。 如 果 尚 未 进行 任何 比赛 ， 你 
怎么 能 知道 每 支 球 队 有 哪些 球员 效力 呢 。 按 照 目前 的 设计 ， 数 据 库 无 法 回答 这 个 问题 。 解 决 
办 法 是 向 Player 表 中 添加 一 个 BaseTeamID 列 。 在 赛季 初 ， 每 支 球 队 会 提交 一 个 名 册 ， 列 出 球 队 
的 初始 成 员 。 球 员 只 能 出 现在 一 支 球 队 的 初始 名 册 上 。 如 果 某 人 替补 或 转 会 ， 数 据 会 重新 记 
录 在 PlayerStats 表 中 。 


3.11 将 类 图 转化 为 规范 化 的 表 


每 个 规范 化 的 表 代表 了 一 个 业务 实体 或 类 。 因 此 一 张 类 图 可 以 转化 为 一 系列 规范 化 的 表 。 
同样 ， 一 系列 规范 化 的 表 可 以 绘制 成 一 张 类 图 。 技 术 上 ， 一 张 类 图 中 的 实体 不 必 非 要 满足 3NF 
(或 更 高 )。 有 些 设计 者 使 用 类 图 作为 业务 的 概念 模型 ， 这 省 略 了 一 些 规范 化 的 细节 。 在 这 种 
情况 下 ， 需 要 将 类 转化 成 一 系列 规范 化 的 表 。 正 如 第 2 章 所 述 ， 类 图 中 一 些 公 共 的 功能 ， 因 此 
你 要 学 会 如 何 进 行 基本 的 转化 。 
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图 3-33 描 述 了 一 个 典型 的 订购 单 类 图 ， 它 包含 四 类 基本 关系 :(1) 供应 商 和 购买 者 订单 之 
间 的 一 对 多 关系 ， (2) 购买 订单 和 商品 之 间 的 多 对 多 关系 ， (3) 包含 不 同属 性 的 子 类 型 关 
系 ; (4) Employee 实 体 中 的 递归 关系 ， 表 示 有 些 雇员 是 其 他 雇员 的 经 理 。 


Manager 


| | 









子 类 型 





Materiais Components Supplies 
图 3-33 将 类 图 转化 为 规范 化 的 表 。 注 意 四 种 关系 类 型 : (1) 一 对 多 ，(2) 多 
对 多 ，(3) 子 类 型 和 (4) 递归 


3.11.1 一 对 多 关系 


将 类 图 转化 成 规范 化 表 的 最 重要 原则 是 ， 通 过 在 每 个 相关 表 中 设置 一 个 公共 列 来 处 理 关 
系 。 此 列 通 常 是 某 张 表 的 主 码 列 。 在 一 对 多 关系 里 可 以 很 容易 地 看 到 这 个 过 程 。 

订购 单 例子 里 有 两 个 一 对 多 关系 : (1) 很 多 不 同 的 订购 单 可 以 发 往 每 个 供应 商 ， 但 每 个 
订购 单 上 只 能 出 现 一 个 供应 商 。(2) 每 个 订购 单 只 能 由 一 名 职员 创建 ， 而 一 名 职员 可 以 创建 
很 多 订购 单 。 要 创建 规范 化 的 表 ， 首 先 为 每 个 实体 (Supplier、Employee 和 Purchase Order) 创 
建 一 个 主 码 。 如 图 3-34 所 示 ， 规 范 化 的 表 可 以 通过 在 PurchaseOrder 表 中 放置 Supplier 表 的 主 码 
(SID) 和 Employee 表 的 主 码 (EID) 来 进行 连接 。 仔 细 注 意 ， 所 有 的 类 图 关联 都 以 主 码 之 间 


Supplier 1 Purchase 0rder 1 Employee 


Supplier(SID, Name, Address, City, State, ZiP, Phone) 
Empioyee(EID, Name, Salary, Address, ...) 


PurchaseOrder(POID, Date, SID, EID) 


图 3-34 转换 一 对 多 关系 。 将 一 方 实体 的 主 码 添 加 到 多 方 实体 的 表 中 。 在 示例 
中 ，SID 和 EID 添 加 到 PurchaseOrder 表 中 。 注 意 ， 它 们 不 是 Purchase- 
Order 表 的 主 码 


还 要 注意 ，SID 和 EID 不 是 PurchaseOrder 表 的 主 码 列 。 你 可 以 检查 哪些 列 应 当 设 为 主 码 。 
从 POID 列 开始 。 对 于 每 个 PurchaseOrder (POID)， 有 多 少 供应 商 ? 业 务 规则 规定 每 个 订购 单 
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只 能 有 一 位 供应 商 ， 因 而 SID 不 应 设 为 主 码 ， 不 必 为 SID 加 下 划 线 。 现 在 从 SID 开 始 从 相反 方向 
检查 。 对 于 每 位 供应 商 ， 有 多 少 订购 单 ? 业务 规则 规定 多 个 订购 单 可 以 发 往 一 个 已 知 的 供应 
商 ， 因 此 PID 列 需要 设 为 主 码 。 相 同 的 过 程 指出 EID 不 应 为 主 码 ， 它 属于 PurchaseOrder 表 ， 
为 每 位 Employee 可 以 下 多 个 订单 。 图 3-35 使 用 示例 数据 说 明 表 之 间 是 如 何 通过 主 码 列 连接 的 。 


Supplier 


-1436-9632 
| 67209 | 316-999-3312 | 





2004 N5676 
22235 | 120 04 T5676 
| 22236 | 9-10-2004 | 7981 ， 
22237 | 9-11-2004 |88727| 335 | 





图 3-35 一 对 多 关系 的 示例 数据 。Supplier 表 和 PurchaseOrder 表 通过 SID 列 连接 。 
类 似 地 ，Employee 表 通过 EID 列 中 的 数据 连接 。SID 和 EID 列 都 是 
PurchaseOrder 表 的 外 码 ， 但 它们 不 是 那 张 表 的 主 码 


3.11.2 多 对 多 关系 
概观 类 图 通常 包含 多 对 多 关系 。 但 是 ， 在 关系 数据 库 中 ， 多 对 多 的 关系 必须 划分 成 两 个 一 
对 多 的 关系 以 满足 BCNF。 图 3-36 描 述 了 处 理 PurchaseOrder 表 和 Item 表 的 过 程 。 


Purchase0rder(P0ID, Date, SID, EID) 
1 


pOltem(POID, itemlD, Quantity, PricePaid) | | 





1 
ltem(ltemID, Deseription, ListPrice) 


图 3-36 转换 多 对 多 关系 。 多 对 多 关系 使 用 一 一 个 新 的 中 间 表 来 连接 两 张 表 。 新 
的 POItem 表 包含 PurchaseOrder 表 和 Item 表 的 主 码 





两 个 初始 实体 中 的 每 个 都 变 成 一 张 表 
(PurchaseOrder 和 Item) 。 下 一 步 是 创建 一 张 新 表 
(POItem ) , 它 包 含 另 两 张 表 的 主 码 (POID 和 ItemID ) 。 
此 表 表 示 多 对 多 的 关系 。 每 个 订购 单 (POID) 能 包 
含 多 项 ， 因 此 ItemID 必 须 设 为 主 码 。 类 似 地 ， 每 项 
也 可 以 在 多 个 订购 单 (POID) 中 订购 ， 因 此 POID 
也 必须 设 为 主 码 。 

你 必须 有 一 张 包 含 POID 和 ItemID 作 为 复合 码 的 
表 。 能 否 建 立 这 种 关系 而 不 创建 第 3 张 表 ? 大 多 数 情 
况 答案 是 否定 的 。 考 虑 一 下 ， 如 果 将 ItemID 列 放 入 
PurchaseOrder 表 ， 并 将 其 设 为 部 分 主 码 ， 会 发 生 什 
么 ?结果 实体 将 是 不 满足 3NF 的 表 ， 因 为 Date、SID 
和 EID 都 不 依赖 于 ItemID。 如 果 将 主 码 POID 放 入 
Item 表 ， 会 产生 类 似 的 问题 。 因 此 ， 中 间 表 是 必需 
的 。 图 3-37 使 用 示例 数据 说 明 三 个 表 是 如 何 通过 主 
码 连接 起 来 的 。 


3.11.3 多 重 关 联 
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PurchaseOrder_ -ww 


Sale .0 
ET 生生 


[We 上 0 
ET Sheet steel 5,928.00 
Brake assembly | 152.00 | 


图 3-37 多 对 多 关系 的 示例 数据 。 注 意 ， 中 
间 表 POItem 连 接 其 他 两 张 表 。 检 查 
这 三 张 表 满足 3NF， 其 中 每 一 非 主 
码 列 依赖 且 只 依赖 于 整个 主 码 





正如 第 2 章 所 述 ， 多 重 关 联 以 菱形 标记 。 这 个 菱形 关联 也 会 成 为 一 个 类 。 某 种 意义 上 讲 ， 
一 个 多 重 关联 可 以 简单 地 看 作 是 若干 二 元 关联 的 集合 。 如 图 3-38 所 示 ， 新 的 关联 类 拥有 其 他 每 
个 类 的 主 码 。 只 要 二 元 关联 是 一 对 多 的 ，Assembly 类 中 的 每 一 列 都 会 成 为 主 码 的 一 部 分 。 如 
果 一 个 二 元 关联 是 一 对 一 的 ， 那 么 相应 的 列 就 不 应 设 为 主 码 。 






ee Jones 
| Rio 
|ProductiD | 


ee 
X32 Corvette 
B17 Camaro 
Product | 


图 3-38 多 重 关联 。Assembly 关 联 也 是 一 个 类 。 它 可 以 看 作 是 一 个 二 元 (一 对 
多 ) 关联 的 集合 。 新 的 Assembly 类 包含 每 个 主 类 的 主 码 


94 ” 弟 一 部 分 和 尼 统 砚 矿 


3.11.4 概括 或 子 类 型 


有 些 业 务实 体 作为 子 类 型 创建 。 图 3-39 通 过 Item 实 体 描述 这 种 关系 。 一 个 项 是 购买 物品 的 
一 般 描述 。 每 个 项 都 有 一 个 描述 和 一 个 标价 。 但 是 ， 公 司 处 理 三 种 类 型 的 项 : 原料 、 装 配 元 
件 和 办 公用 品 。 每 种 子 类 型 都 有 一 些 你 希望 记录 的 附加 属性 。 例 如 ， 公 司 记录 原料 的 重量 、 
装配 元 件 的 尺寸 以 及 办 公用 品 的 数量 折扣 。 

在 将 此 设计 转化 为 关系 数据 库 时 ， 有 两 种 基本 方法 。(1) 如 果子 类 型 都 很 相似 ， 可 以 忽 
略 子 类 ， 将 所 有 的 子 类 压缩 到 主 类 中 ， 主 类 将 会 包含 每 个 子 类 的 所 有 属性 。 在 这 种 情况 下 ， 
每 条 数据 项 将 会 有 若干 空 值 。(2) 大 多 数 情况 下 ， 更 好 的 办 法 是 为 每 个 子 类 创建 单独 的 表 。 
每 张 表 都 将 包含 主 类 Item 的 主 码 。 

如 图 3-40 所 示 ， 每 一 项 都 在 Item 表 中 有 一 条 记录 。 在 三 个 子 类 型 表 之 一 还 有 另外 一 条 记录 
依赖 于 特殊 项 。 例 如 项 444098 在 Item 表 中 描述 ， 其 余数 据 存储 在 OfficeSupplies 表 中 。 

如 果子 类 关系 不 互 斥 ， 那 么 每 个 主 项 可 以 在 多 个 子 类 表 中 拥有 相应 的 行 。 















ee Naber sioor — | 
| 888371\ Wrake assembly | 


eet steel 
rake assembly | 





temiv 


ltemlltemlD, Description, ListPrice) 
RawMaterials(ltemlD, Weight, StrengthRating) 


AssembledComponents(ItemiD, Width, Height, Depth) 





OfficeSupplies(ttemlD, BulkQuantity, Discount) 


图 3-39 转化 子 类 型 。 每 件 购买 商品 具有 基本 属 
性 ， 记 录 在 Item 表 中 。 每 件 商品 属于 三 


种 类 型 之 一 ， 这 三 类 具有 不 同 的 属性 。 
要 把 这 些 关系 转化 为 3NF， 为 每 种 子 类 型 。 图 3-40 子 类 型 关系 的 示例 数据 。 注 意 ， 现 在 每 


创建 新 表 。 在 新 表 和 普通 表 中 使 用 相同 件 商品 在 Item 表 及 三 个 子 类 型 表 之 一 都 
的 主 码 。 为 每 种 子 类 型 添加 特殊 的 属性 有 一 行 
3.11.5 组 合 


从 某 种 角 广 讲 ， 组 合 是 一 个 多 重 关 联 和 子 类 型 的 合并 。 考 虑 图 3-41 所 示 的 自行 车 例子 ， 一 
辆 自行 车 由 各 种 元 件 组 装 而 成 。 第 一 个 要 做 的 决定 是 如 何 处 理 多 个 元 件 。 这 是 一 个 子 类 型 的 
问题 。 在 此 例 中 ;业务 几乎 记录 了 每 个 元 件 各 自 的 数据 (ID 号 、 规 格 、 重 量 、 成 本 、 标 价 ， 
等 等 )。 因 此 ， 一 个 好 的 解决 办 法 是 将 所 有 子 类 型 压缩 到 一 个 通用 的 Component 类 中 。 然 而 ， 
单独 处 理 车 轮 也 可 以 ， 因 为 它们 是 更 复杂 组 件 。 

你 可 以 通过 在 主 Bicycle 表 中 为 每 个 元 件 (WheelID 、CrankID 、StemID ， 等 等 ) 创建 属性 
来 解决 主要 的 组 合 问题 。 这 些 列 是 Bicycle 表 的 外 码 (但 非 主 码 ) 。 当 制造 一 辆 自行 车 时 ， 安 装 
元 件 的 ID 值 将 存储 在 Bicycle 表 的 适当 列 中 。 通 过 查看 实际 的 Rolling Thunder 数 据 库 ， 可 以 找 


种 3 瘟 ”数据 规范 化 95 


到 更 多 信息 。 


SerialNumber 
ModelType 
WheellD 


ComponentlD 


Dos 
Description 
CrankiD Weight 


Se Cost 





图 3-41 规范 化 一 个 组 合 关联 。 首 先决 定 如 何 处 理子 类 。 在 此 例 中 ， 把 它们 合 
并 到 一 个 Component 表 中 。 第 二 ， 通 过 在 主 Bicycle 表 中 存储 适当 的 
Component 主 码 值 来 处 理 组 合 


3.11.6 自 反 关 联 


有 时 候 , 一 个 实体 可 能 与 自身 连接 。 一 个 常见 的 例子 如 图 3-42 所 示 ,， 其 中 职员 里 包含 经 理 。 
由 于 经 理 本 身 也 是 职员 ， 所 以 这 个 实体 连接 到 自身 。 当 建立 相应 的 表 时 会 很 容易 看 出 这 种 关 
系 。 简 单 地 向 Employee 表 添加 一 个 Manager 列 即 可 。 这 一 列 的 数据 包含 一 个 EID。 例 如 ， 第 一 
i (Smith，EID 221) 向 经 理 335 (Sanchez) 汇报 工作 。Manager 列 是 主 码 的 一 部 分 吗 ? 
， 因 为 业务 规则 规定 一 个 雇员 只 能 有 一 个 经 理 。 


Manager 


el 


Employee(EID, Name, Salary, Address, Manager) 
Employee 

221 | Smith __ mit hh 67,000 _ 

| 335 -Sanehez | 


0 
| 35,000 | 440E- 5200 3 335 | 





图 3-42 转化 递归 关系 。 一 个 雇员 只 能 有 一 位 经 理 ， 因 此 向 Employee 表 添加 
Manager 列 ， 表 中 包含 指向 经 理 的 EID 列 。 在 示例 中 ，Smith 向 
Manager335 (Sanchez) 汇报 
一 个 雇员 能 有 多 个 经 理 的 情况 该 如 何 处 理 呢 ? 将 Manager 列 设 为 主 码 ? 不， 因为 那样 的 话 
Employee 表 就 不 满足 BCNE 了 (一 个 职员 的 地 址 不 依赖 于 他 的 经 理 ) 。 解 决 方案 是 创建 一 个 新 
表 列 出 EmployeeID 和 ManagerID， 两 列 都 是 主 码 的 一 部 分 。 这 个 新 表 可 能 有 额外 的 数据 来 描述 
职员 和 经 理 之 间 的 关系 ， 例如 一 个 项 目 或 任务 。 


3.11.7 小 结 


创建 一 个 详细 的 类 图 其 实 和 创建 一 系列 规范 化 的 表 是 一 样 的 。 事 实 上 ， 类 图 和 规范 化 的 表 
都 是 业务 模型 。 无 论 是 用 线段 还 是 通过 主 码 来 表示 关联 ， 都 必须 符合 业务 规则 。 如 果 从 类 图 
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开始 ， 那 么 一 定 要 验证 每 个 类 都 满足 BCNF。 而 且 ， 一 定 要 检查 特殊 的 情况 ， 诸 如 多 重 关联 、 
概括 、 组 合 以 及 自 反 关联 。 


3.11.8 Sally 的 宠物 商店 示例 


要 设计 Sally 的 宠物 商店 数据 库 ， 和 店主 交谈 并 且 调研 其 他 商店 的 经 营 方式 。 在 收集 各 种 表 
单 信息 的 过 程 中 ， 你 开始 了 解 业务 规则 。 为 了 加 快 开 发 进度 并 降低 成 本 ， 你 和 Sally 都 同意 先 从 
一 个 简单 的 模型 开始 ， 以 后 再 添加 功能 。 图 3-43 所 示 的 销售 表单 包含 销售 活动 所 需 的 主要 数据 。 


Customer Employee ID 
Name Name 
Address 

City State, Zip 


Animal Sale 
ID Name Category Breed DoB Gender Reg. Color ListPrice SalePrice 





Merchandise Subtotal 
Subtotal 

Tax 

Total 





图 3-43 宠物 商店 示例 的 销售 表单 。 将 销售 的 动物 和 商品 分 开 ， 表示 业 务 规则 
上 要 分 别 对 待 它们 

Sally 希 望 你 为 动物 和 产品 创建 单独 的 订购 单 。 她 反复 强调 收集 动物 详细 信息 的 重要 性 ， 从 
收集 饲养 者 的 信息 到 最 终 收 集 动物 谱系 的 数据 。 对 于 像 猫 和 狗 这 样 已 注册 的 动物 ， 这 些 数 据 很 
容易 获得 。 然 而 ， 要 获取 鱼 的 记录 就 很 难 。Sally 还 希望 获取 所 购 宠物 的 医疗 记录 。 一 般 的 数据 
包括 它们 注射 的 疫苗 、 相 关 疾病 和 它们 接受 过 药物 或 治疗 。 目 前 ， 她 依赖 于 饲养 者 保存 这 些 信 
息 。 然 而 ， 一 旦 创建 了 销售 和 基本 的 金融 应 用 之 后 ， 她 希望 将 这 些 功 能 添加 到 数据 库 。 

自前 最 重要 的 工作 是 收集 交易 数据 。 图 3-44 显 示 从 饲养 者 那里 购买 动物 时 必须 记录 的 最 少 
金融 数据 。 注 意 收集 关于 动物 、 供 应 商 / 饲 养 者 、 客 户 和 职员 数据 的 重要 性 。 由 于 预期 的 变化 ， 
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将 数据 库 设 计 得 灵活 是 很 重要 的 。 设 计 需 要 很 容易 为 所 有 主要 实体 添加 新 属性 。 还 应 当 很 容 
易 添加 新 表 (例如 健康 记录 ) 而 不 必 对 初始 结构 做 大 量 修改 。 











Purchase Order for Animals 
Order# Date Ordered 
Date Received 











Supplier Employee ID 


Name Name 
Contact Home Phone 
Phone Date Hired 


Address 
City State ZIPcode 


Animal Descriptions 
Name Category Breed Gender Registration Price 





Subtotal 
Shipping Cost 


Total 


图 3-44 宠物 商店 示例 的 购买 动物 订单 。 更 多 的 信息 会 在 未 来 收集 一 -尤其 是 
每 种 动物 的 健康 和 谱系 数据 


从 供应 商 购买 商品 的 流程 与 购买 宠物 相似 。 但 是 ， 有 一 些 细 微 的 区 别 。 特 别 地 ， 你 需要 为 
每 件 商品 收集 不 同 的 数据 。 

一 个 示例 表单 如 图 3-45 所 示 。 再 次 记 住 ，Sally 希 望 从 一 个 小 型 数据 库 开始 。 以 后 将 会 收集 
附加 的 数据 。 例 如 ， 当 订单 的 货物 到 达 ， 有 些 商品 丢失 ， 会 发 生 什么 ? 当前 的 表单 只 能 记录 
完整 货运 的 到 达 。 类 似 地 , 每 家 供应 商 可 能 使 用 独特 的 Item 编 号 集合 。 例 如 ， 对 于 同一 饶 猫 食 ， 
一 家 供应 商 可 能 以 ItemID 3325 订 购 ， 另 一 家 供应 商 可 能 会 以 ItemIDA9973 订 购 。 最 终 ，Sally 
希望 记录 其 主要 供应 商 的 编号 。 这 样 ， 当 货物 带 着 编号 抵达 时 ， 将 产品 与 她 的 订单 相 匹配 就 
变 得 更 加 容易 。 

设计 宠物 商店 数据 库 的 下 一 个 步 是 根据 每 张 表单 创建 将 用 于 存储 该 表单 数据 的 所 有 规范 化 
的 表 。 图 3-46 显 示 从 Sales 表 单 得 到 的 表 。 在 详细 检查 结果 之 前 ， 应 当 进行 数据 规范 化 。 看 你 
是 不 是 得 到 了 相同 的 结果 。 还 应 当 获 取 另 两 张 表单 的 规范 化 表 。 要 双重 检查 你 的 工作 。 首 先 
确保 主 码 正确 ， 然 后 检查 每 个 非 主 码 列 是 否 依赖 且 仅 依赖 于 整个 主 码 。 

在 SaleAnimal 和 AnimalOrderltem 表 中 (图 3-46) 存在 一 个 有 趣 的 假设 。 SaleAnimal 表 使 用 
SaleID 和 AnimalID 作 为 主 码 。 这 意味 着 每 次 销售 可 以 包含 若干 动物 。 这 还 意味 着 每 只 动物 可 
以 售 出 若干 次 。 后 一 种 假设 是 可 能 的 吗 ? 一 只 动物 能 否 售 出 多 次 ? 如果 不 能 ， 那 么 SaleID 就 不 
应 设 为 主 码 的 一 部 分 ， 可 以 把 它 直接 插入 到 Animal 表 中 。 同 样 ， 能 否 多 次 购买 同一 只 动物 ? 
如 果 丰 能， 那么 OrderID 可 以 放 入 Animal 表 中 ， 但 并 不 设 为 主 码 的 一 部 分 。SaleAnimal 和 
AnimalOrderItem 表 的 其 他 数据 也 可 以 放 到 Animal 表 中 。 尽 管 这 种 方法 显得 更 实际 ， 但 缺乏 灵 
活性 。 这 样 设计 数据 库 意味 着 宠物 商店 永远 不 能 两 次 售 出 同一 只 动物 。 那 么 该 如 何 处 理 一 只 
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退回 的 动物 呢 ? 












Purchase Order for Merchandise 
Order# Data Ordered 
Date Received 





Supplier Employee ID 












Name Name 
Contact Home Phone 
Phone 

Address 


City, State ZIPcode 








ltems Ordered 
HemiD Description Category Price Quantity Ext. QOH 


Subtotal 
Shipping Cost 
Total 





图 3-45 宠物 商店 示例 的 购买 商品 订单 。 注 意 这 两 种 订单 的 相似 性 与 不 同 。 记 
住 , 更 多 的 数据 会 在 未 来 收集 













Sale{SaleIDp, Date, CustomerID, REmployeeID) 
SaleAnimal (SaleID, AnimalID, SalePrice) 
SaleMerchandise (SaleID， ltemID, SalePrice, Quantity) 
Customer (CustomeriD, Name, Address, City, State, 2Zip) 
Employee (Employee1D, Name) 

Animal (AnimalID, Name, Category, Breed, DateOfBirth, Gender, 
Registration, Color, ListPrice) 

Merchandise (Itemih, Description, Category, ListpPrice) 


图 3-46 宠物 商店 基本 销售 表单 的 规范 化 表 。 应 当 首 先进 行规 范 化 ， 然 后 检查 
你 的 结果 是 否 与 这 些 表 一 致 


3.12 视图 集成 


到 目前 为 止 ， 已 经 使 用 单独 的 报表 和 表单 对 数据 库 设计 和 规范 化 进行 了 讨论 ， 这 是 设计 数 
据 库 的 基本 手段 。 但 是 ， 大 部 分 项 目 包含 很 多 报表 和 表单 。 有 些 项 目 会 有 一 个 设计 团队 ， 其 
中 每 个 人 都 从 不 同 的 用 户 和 部 门 收集 表单 和 报表 。 每 位 设计 者 为 各 自 的 表单 创建 规范 化 的 表 ， 
你 最 后 得 到 与 同一 主题 相关 的 很 多 表 。 此 时 ， 需 要 将 所 有 这 些 表 集成 到 一 个 完整 的 、 一 致 的 
数据 表 定 义 集合 中 。 

当 你 完成 这 一 阶段 ， 就 可 以 将 表 的 定义 输入 DBMS 中 。 尽 管 你 可 能 最 后 得 到 很 多 相互 关联 
的 表 ， 这 一 步 一 般 还 是 要 比 初始 推导 获得 满足 3NF 的 表 要 容易 。 此 时 ， 你 收集 所 有 的 表 ， 确 保 
命名 的 一 致 性 ， 从 相似 表 中 合并 数据 。 合 并 表 的 基本 步骤 如 下 : 

“收集 多 种 视图 (文档 、 表 单 ， 等 等 ) 
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。 为 每 篇 文档 创建 规范 化 的 表 
。 将 视图 合并 为 一 个 完整 的 模型 


3.12.1 Sally 的 宠物 商店 示例 


图 3-47 描 述 宠物 商店 示例 的 视图 集成 过 程 。 首 先 列 出 由 三 个 输入 表单 生成 的 表 。 集 成 从 查 
找 包含 相似 数据 的 表 开始 。 一 个 好 的 起 点 是 查看 主 码 。 如 果 两 张 表 有 相同 的 主 码 ， 那 么 一 般 
应 该 合并 。 然 而 ， 要 小 心 。 有 时 主 码 是 错误 的 ， 有 时 主 码 的 名 称 可 能 有 细微 的 不 同 。 


Sale(SaleID, Date, CustomerID， EmployeeID) 

SaleAnimal (SaleID, AnimalID, SalePrice) 
SaleItem(SaleID， ItemID, SalePrice, Quantity) 
Customer (CustomerID, Name, Address, City, State, 2Zip) 
Employee (EmployeeID, Name, Phone, DateHired) 

Animal (AnimalID, Name, Category, Breed, DateOfBirth， 
Gender, Registration, Color, ListPrice, Cost) 
Merchandise(ItemID, Description, Category, ListPrice, 
QuantityOonHand) 


AnimalOrder (QrderID, OrderDate, ReceiveDate, SupplierID, 
EmpID, ShipCost) 
AnimalOrderItem(OrderID, AnimalID, Cost) 


Supplier (SupplierID, Name, Contact, Phone, Address, City, 
State, 2ip) 


MerchandiseOrder (PONumber, OrderDate, ReceiveDate, SID, 
EmpID, ShipCost) 
MerchandiseOrderItem(PONumber, ItemID, Quantity, Cost) 





图 3-47 完 物 商店 的 视图 集成 。 相 似 表 中 的 数据 列 可 以 合并 到 一 张 表 中 。 例 如 ， 
我 们 只 需要 一 张 Employee 表 。 查 找 具 有 相同 主 码 的 表 。 目 标 是 得 到 一 
个 规范 化 表 的 集合 ， 它 能 储存 所 有 表单 和 报表 的 数据 


注意 ，Employee 表 在 例子 中 出 现 三 次 。 通 过 仔细 检查 每 个 列表 中 的 数据 ， 可 以 构造 一 张 
包含 所 有 列 的 新 表 。 因 此 ，Phone 列 和 DateHired 列 移 到 一 张 表 中 ， 另 外 两 张 表 被 删除 。 对 
Supplier 表 、Animal 表 和 Merchandise 表 可 以 进行 相似 处 理 。 此 过 程 的 目标 是 创建 一 系列 完整 的 
规范 化 的 表 ， 将 存储 所 有 表单 和 报表 中 的 数据 。 一 定 要 双重 检查 ， 以 确保 最 终 的 所 有 表 满 足 
3NF 或 BCNF。 另 外 ， 确 保 这 些 表 可 以 通过 相关 列 的 数据 进行 连接 。 

最 终 确定 的 表 也 可 以 显示 在 一 张 详细 的 类 图 上 。 完 物 商店 的 类 图 如 图 3-48 所 示 。 类 图 的 一 
个 好 处 是 能 够 显示 类 ( 表 ) 之 间 是 如 何 通 过 关系 相连 的 。 双 重 检查 你 的 规范 化 处 理 以 确保 基 
本 的 表单 可 以 重新 创建 。 例 如 ， 销 售 表单 可 以 从 Customer、Employee 和 Sale 表 开始 建立 。 动 物 
的 销售 需要 SaleAnimal 和 Animal 表 。 产 品 的 销售 需要 SaleItem 和 Merchandise 表 。 所 有 这 些 表 都 
能 通过 它们 属性 的 关系 进行 连接 。 
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图 3-48 宠物 商店 类 图 。 表 变 成 类 图 中 的 实体 。 关 系 验 证 表 之 间 通 过 数据 互相 
连接 。 添 加 了 一 些 新 职员 。 另 外 ， 为 了 简化 数据 条 目 ， 城 市 定义 在 一 
张 单独 的 表 中 。 同 样 ， 新 Breed 和 Category 表 确保 了 数据 的 一 致 性 


大 部 分 关系 是 一 对 多 的 关系 ， 但 要 注意 方向 。Access 用 一 个 无 穷 大 (= ) 符号 来 标记 多 的 
一 边 。 当 然 ， 你 首先 应 当 从 业务 规则 来 确定 恰当 的 关系 。 例 如 ， 每 位 客户 可 以 有 多 条 消费 记 
录 ， 但 是 每 条 消费 记录 只 能 列 出 一 位 客户 。 

图 3-48 所 示 的 最 终 类 图 包含 三 张 新 表 : City，Breed 和 Category。 添 加 这 些 确认 表 用 于 简化 
数据 输入 和 保持 数据 一 致 性 。 如 果 没 有 这 些 表 ， 雇 员 将 不 得 不 重复 输入 城市 名 称 、 品 种 和 类 
别 的 文本 数据 。 让 用 户 录 入 这 些 数据 存在 两 个 问题 : (1) 浪费 时 间 ，(2) 用 户 可 能 每 次 输入 
不 同 的 数据 。 通 过 在 这 些 表 中 存放 标准 数据 ， 雇 员 可 以 从 列表 中 选择 适当 的 数据 。 因 为 这 些 
标准 数据 总 会 拷贝 到 新 表 中 去 ， 因 此 ， 每 次 输入 的 数据 都 是 相同 的 。 

让 DBMS 强 制 特定 的 关系 造成 了 一 个 有 趣 的 结果 。 这 些 关 系 需 要 数据 按 指定 顺序 输入 。 外 
码 关系 指定 某 位 客户 的 数据 必须 首先 在 Customer 表 中 存在 ， 然 后 才能 放 进 Sale 表 。 从 业务 观点 
上 看 这 条 规则 是 有 意义 的 ， 你 必须 首先 遇见 客户 ， 然 后 才能 卖 给 他 们 东西 。 然 而 ， 这 条 规则 
可 能 会 给 输入 销售 数据 的 职员 带 来 问题 。 你 需要 某 种 机 制 ， 在 他 们 要 输入 Sales 数 据 之 前 ， 帮 
助 他 们 输入 新 的 Customer 数 据 。 


3.12.2 Rolling Thunder 示 例 中 的 集成 问题 


掌握 数据 库 设计 和 理解 规范 化 的 惟一 方法 是 进行 更 多 的 练习 。 为 了 对 数据 规范 化 的 概念 进 
行 实践 和 介绍 合并 表 集 的 方法 ， 考 虑 一 个 包含 数据 库 的 小 型 制造 厂 的 新 问题 : Rolling Thunder 
自行 车 。 这 家 公司 为 客户 定制 的 自行 车 。 在 公司 内 部 制造 框架 并 喷漆 。 零 部 件 从 生产 厂 购买 ， 
按照 顾客 的 意愿 组 装 成 自行 车 。 零 部 件 ( 曲 柄 、 踏 板 、 变 速 器 等 ) 一 般 进行 分 组 以 便 客 户 可 
以 选 定 一 整套 零 部 件 ， 而 不 必 单 独 指定 每 一 项 。 其 他 有 关 自 行车 和 公司 运营 的 详细 信息 可 从 
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要 从 各 种 角度 理解 规范 化 和 表 集 成 的 过 程 ， 考 虑 四 张 输入 表单 : Bicycle Assembly、 
Manufacturer Transactions、Purchase Orders 和 Components 。 

制造 者 使 用 图 3-49 所 示 的 Bicycle Assembly 表 单 决定 框架 的 基本 设计 ， 喷 漆 的 样式 和 需要 
安装 的 零 部 件 。 当 完成 框架 制造 和 零 部 件 组 装 之 后 ， 工 人 们 要 对 操作 进行 核对 。 雇 员 标 识 和 
日 期 /时 间 存 储 进 数 据 库 中 。 当 零 部 件 组 装 完毕 后 ， 库 存 数量 自动 减少 。 当 自行 车 发 送出 去 ， 
触发 器 执行 代码 记录 用 户 的 应 付款 以 便 打印 并 邮寄 账单 。 


E Bicycle Assembly 


Bicycle Assembly 





























0 JLV-800ST! 
0 [BR-UL600 5151 

















图 3-49 Bicycle Assembly 表 单 。 主 EmployeeID 控 制 不 直接 存储 ， 但 是 当 雇 员 点 
击 Frame 杠 时， 该 值 在 Bicycle 表 的 FrameAssembler 列 中 输入 


从 表单 中 收集 数据 列 , 得 到 图 3-50 所 示 的 结果 。 注意 , 出 现 了 两 个 重复 组 (管子 和 零 部 件 )， 
但 它们 相互 独立 地 重复 、 不 骸 套 。 


BicycleAssembly( 
SerialNumber, Model, Construction, FrameSize, TopTube, 
ChainSstay, HeadTube, SeatTube, PaintID, PaintColor, 
ColorStyle, ColorList， CustomName, LetterStyle, EmpFrame, 
EmpPaint, BuildDate, ShipDate, 
(Tube, TubeType, TubeMaterial, TubeDescription), 
(CompCategory, ComponentID, SubstID, ProdNumber, 
EmpInstall, DateInstall, Quantity, QOH) ) 


Bicycle(SerialNumber, Model, Construction, FrameSize, 
TopTube, ChainStay, HeadTube, SeatTube, PaintID， 
ColorStyle, CustomName, LetterStyle, EmpFrame, EmpPaint, 
BuildDate, ShipDate) 

Paint (PaintID, ColorList) 

BikeTubes (SerialNumber, TubeID, Quantity) 

TubeMaterial (TubeID, Type, Material, Description) 
BikeParts (SerialNumber, ComponentID, SubstID, Quantity, 
DateInstalled, EmpInstalled) 

Component (ComponentID, ProdNumber, Category, QOH) 





图 3-50 BicycleAssembly 表 单 的 标记 。 存 在 两 个 重复 组 ， 但 它们 相互 独立 。 从 
此 表单 得 到 4NF 表 ， 你 应 当 试 着 自己 推导 这 些 表 
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零 部 件 和 其 他 用 料 从 生产 厂 购 买 。 当 用 料 过 少时 就 会 下 订单 并 记录 在 Purchase Order 表 单 
上 。 如 图 3-51 所 示 ，Purchase Order 包 含 关于 生产 厂 的 标准 数据 ， 以 及 订购 的 零 部 件 (或 其 他 
用 料 ) 列表 。 


PurchaseOrder (PurchaseID, PODate, EmployeeID, FirstName, 
LastName, ManufacturerID, MfgName, Address, Phone, CityID, 
CurrentBalance, ShipReceiveDate, (ComponentID, Category, 
ManufacturerID, ProductNumber, Description, PricePaid, 
Quantity, ReceiveQuantity, ExtendedValue, QOH, 
ExtendedReceived), ShippingCost, Discount) 


PurchaseOrder (PurchaseID, PODate, EmployeeID, ManufacturerID, 
ShipReceiveDate, ShippingCost, Discount) Employee (EmployeeID, 
FirstName, LastName) 

Manufacturer (ManufacturerID, Name, Address, Phone, Address, 
CityID, CurrentBalance) 

City(CityID, Name, ZipCode) 

PurchaseItem(PurchaseID, ComponentID, Quantity, PricePaid, 
ReceivedQuantity) 

Component (ComponentID, Category, ManufacturerID, 
ProductNumber, Description, QOH) 





图 3-51 从 Purchase Order 表 单 得 到 的 表 。 注 意 ， 计 算得 到 的 列 (扩展 为 价格 * 
数量 ) 没有 存储 在 表 中 


经 过 推导 的 标记 和 满足 4NF 的 表 如 图 3-52 所 示 。 你 应 当 自 己 独 立 练习 规范 化 的 过 程 。 注 意 ， 
计算 得 到 的 列 不 需要 存储 。 但 是 ， 要 小 心 存储 运输 成 本 和 折扣 ， 因 为 它们 可 能 是 每 次 单独 商 
议 确定 的 。 


Purchase Order 


Purchase Qrder 





图 3-52 Purchase Order 表 单 。 只 有 订购 的 商品 是 一 个 重复 组 。Look for 
Products 部 分 为 用 户 提供 便利 ， 它 并 不 存储 数据 。Date Shipment 
Received 框 初始 时 是 空白 的 ， 当 产品 到 达 码 头 时 才 被 填充 
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给 生产 厂 的 付款 记录 在 图 3-53 所 示 的 基本 交易 表单 中 。 注 意 ， 初 始 余额 和 不 足 额 由 表单 所 
支持 的 代码 计算 得 到 ， 用 来 显示 添加 新 交易 带 来 的 影响 。 购 买 的 数据 条 目 由 Purchase Order 表 
单 自动 生成 ， 因 此 此 表单 一 般 用 于 付款 或 校正 。 


浊 Manufacturer Jransactions 


Manulacturer Transactions 


本 下 Fr 本 


| gy8/2004| 22343 | 910876624 | 
上 on7z2004 $106.304.7 





图 3-53 Manufacturer Transaction 表 单 。 不 足 额 存储 在 数据 库 中 , 但 只 存储 一 次 。 
Initial Balance 和 Balance Due 框 由 表单 计算 得 到 ， 用 于 显示 用 户 添加 事 
务 的 影响 
生产 厂 交 易 的 4NF 表 如 图 3-54 所 示 。 你 仍 应 当 自 己 进行 推导 。 实 践 和 经 验 是 学 会 规范 化 的 
最 好 方法 。 不 要 被 误导 : 读者 通常 会 从 书 中 阅读 “答案 ”并 认为 规范 化 很 容易 。 当 你 自己 解 
决 问题 时 规范 化 会 变 得 复杂 得 多 。 从 一 开始 ， 调 研 和 确定 业务 规则 是 很 有 挑战 性 的 。 


ManufacturerTransactions (ManufacturerID, Name, Phone, 
Contact, BalanceDue, (TransDate, Employee, Amount, 
Description)) 


Manufacturer (ManufacturerID， Name, Phone, Contact, 
BalanceDue) 

ManufacturerTransaction (ManufactureriDp, Transactionpate, 
EmployeeID, Amount, Description) 





图 3-54 从 Manufacturer Transaction 表 单 得 到 的 表 。 这 个 规范 化 过 程 是 很 直接 的 。 
注意 ，TransactionDate 列 还 存储 了 时 间 ， 因 此 有 可 能 在 同一 天 当中 与 
一 个 生产 厂 进行 多 次 交易 
图 3-55 所 示 的 Component 表 单 用 于 向 列表 中 添加 新 零 部 件 和 修改 零 部 件 的 规格 描述 。 它 也 
可 以 用 于 修改 生产 厂 的 数据 。 注 意 两 个 标识 号 码 的 用 处 : 一 个 由 Rolling Thunder 分 配 ， 另 一 个 
由 生产 厂 分 配 。 分 配 我 们 自己 的 号 码 可 以 确保 数据 格式 的 一 致 性 ， 保 证 标识 符 是 惟一 的 。 生 
产 厂 的 产品 号 用 于 下 订单 ， 因 为 生产 厂 不 会 使 用 我 们 的 内 部 数据 。 
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图 3-55 “Component 表 单 。 注 意 ， 零 部 件 有 一 个 Rolling Thunder 雇 员 赋 予 的 内 部 
编号 。 产 品 通常 也 有 一 个 生产 厂 分 配 的 产品 编号 。 依 赖 于 这 个 编号 很 
困难 ， 因 为 多 个 供应 商 之 间 可 能 会 重复 ， 并 且 格 式 也 很 不 同 

从 Component 表 单 得 到 的 4NF 表 如 图 3-56 所 示 。 其 中 绝 大 部 分 是 很 简单 的 。Rolling 
Thunder 数 据 库 中 一 个 有 趣 的 不 同 是 对 地 址 和 城市 的 处 理 。 很 多 关于 顾客 、 雇 员 和 供应 商 等 业 
务 表 包含 城市 、 州 和 ZIP 编 码 的 列 。 从 技术 上 ， 由 于 这 三 项 是 有 关联 的 ， 在 这 些 基 本 数据 中 含 
有 一 个 隐 仿 约束。 因此， 数据 库 可 以 通过 设置 一 个 单独 的 City 表 来 节约 空间 和 数据 输入 时 间 。 
当然 ， 一 个 覆盖 整个 美国 的 City 表 ， 尽 管 与 整个 世界 相 比 小 得 多 ， 但 已 经 很 庞大 了 。 更 困难 的 
问题 在 于 城市 和 ZIP 编 码 之 间 没 有 一 对 一 的 关系 。 有 些 城 市 具有 很 多 ZIP 编 码 ， 而 有 些 ZIP 编 码 
覆盖 多 个 城市 。Rolling Thunder 通 过 维护 一 个 基于 惟一 CityID 的 City 表 来 解决 这 两 个 问题 。 如 
果 空 间 非常 宝贵 ， 这 张 表 可 以 缩减 到 只 包含 数据 库 中 用 到 的 城市 。 当 有 新 城市 的 客户 到 来 时 ， 
只 需 添 加 基本 的 城市 数据 。ZIP 编 码 问题 通过 为 每 个 城市 存储 一 个 基本 ZIP 编 码 来 解决 。 与 每 
个 地 址 相关 的 特定 ZIP 编 码 存储 在 适当 的 表 中 (例如 Manufacturer) 。 这 个 特定 ZIP 编 码 还 可 以 
是 能 更 确切 指出 客户 或 生产 厂 的 九 位 数字 编码 。 尽 管 创 建 一 个 完整 的 九 位 数字 编码 表 是 有 可 
能 的 ， 但 表 会 非常 巨大 ， 并 容易 改变 。 依 赖 于 九 位 数字 进行 邮寄 的 公司 通常 要 购买 包含 验证 
过 的 数据 库 的 确认 软件 来 核对 他 们 的 地 址 和 编码 。 

再 次 考虑 图 3-50、 图 3-51、 图 3-54 和 图 3-56 中 的 表 。 注 意 每 张 图 中 列 出 的 相似 表 。 特 别 要 
注意 Manufacturer 表 。 注 意 ， 重 又 的 表 通 常 包含 来 自 不 同 表单 的 数据 。 现 实 当 中 ， 尤 其 对 一 个 
设计 团队 来 说 ， 相 似 的 列 可 能 具有 不 同 的 名 称 ， 因 此 一 定 要 小 心 。 这 一 步骤 的 目标 是 合并 相 
似 的 表 。 最 好 的 方法 是 从 寻找 公共 主 码 开 始 。 具 有 相同 主 码 列 的 表 应 该 合并 。 例 如 ， 对 
Manufacturer 表 的 各 种 变形 进行 重新 创建 ， 如 图 3-57 所 示 。 通 过 添加 其 他 变形 中 的 Contact 和 
ZipConde 列 ， 可 以 扩充 PO 表 的 形式 。 
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ComponentForm(ComponentID, Product, BikeType, Category, 
Length, Height, Width, Weight, ListPrice, Description, QOH, 
ManufacturerID, Name, Phone, Contact, Address, ZipCode, 
CityID, City, State, AreaCode) 


Component (ComponentID, ProductNumber, BikeType, Category, 
Length, Height, Width, Weight, ListPrice, Description, QOH, 
ManufacturerID) 

Manufacturer (ManufacturerID, Name, Phone, Contact, Address, 
ZipCode, CityID) 

City (CityID, City, State, ZipCode, AreaCode) 





图 3-56 从 Component 表 单 得 到 的 表 。Manufacturer 表 中 的 ZipCode 是 该 公司 特 
有 的 (可 能 是 一 个 九 位 编码 )。City 表 中 的 ZipCode 是 一 个 基本 (五 位 ) 
编码 ， 作 为 一 个 参照 点 ， 一 个 城市 通常 有 很 多 个 这 样 的 编码 


Manufacturer (ManufacturerID, Name, Address, Phone, 
CityID, CurrentBalance) 
Manufacturer (ManufacturerID, Name, Phone, Contact, 


BalanceDue) 
Manufacturer (ManufacturerID, Name, Phone, Contact, 
Address, ZipCode, CityID) 





图 3-57 Manufacturer 表 的 多 个 版 本 。 具 有 相同 主 码 的 表 应 当 合 并 为 一 张 表 。 将 
Contact 和 ZipCode 移 到 第 一 张 表 中 意味 着 可 以 删除 其 他 两 张 表 。 不 要 
把 两 个 名 称 (CurrentBalance 和 BalanceDue) 误解 为 相同 的 列 


在 合并 重复 表 之 后 ， 你 应 该 获得 单一 系列 的 包含 表单 中 所 有 数据 的 表 ， 如 图 3-58 所 示 。 在 
此 时 对 你 的 结果 进行 双重 检查 。 特 别 要 确认 主 码 惟一 以 及 复合 码 表示 多 对 多 的 关系 。 然 后 验 
证 3NF 规 则 ， 每 个 非 主 码 列 是 否 依 赖 并 且 惟 一 依赖 于 整个 主 码 。 还 要 寻找 隐 含 依赖 ， 你 可 能 需 
要 将 它们 显 式 化 。 确 保 通 过 列 中 的 数据 ,这些 表 可 以 连接 到 一 起 。 你 应 当 能 在 所 有 的 表 之 间 
连 线 。 现 在 是 绘制 一 个 更 加 完整 的 类 图 的 时 候 了 。 每 一 个 规范 化 的 表 成 为 一 个 实体 。 关 系 显 
示 这 些 表 如 何 连接 (完整 的 例子 请 查看 Rolling 数 据 库 ) 。 

最 后 ， 查 看 每 张 表 ， 确 定 你 是 否 还 需要 收集 更 多 的 数据 。 例 如 ，Employee 表 肯定 需要 更 
多 数据 ， 诸 如 Address 和 DateHired。 类 似 地 ， 你 会 发 现 ManufacturerTransaction 表 会 使 用 一 个 
Reference 列 ， 当 一 次 交易 由 Purchase Order 表 单 自 动产 生 时 ， 该 列 会 包含 PurchaseID 。 这 一 列 
的 作用 是 作为 查账 索引 ， 从 源头 开始 跟踪 交易 的 账目 。 有 些 人 可 能 会 使 用 日 期 /时 间 ， 但 精确 
到 秒 一 级 的 交易 可 能 会 引发 问题 。 


3.13 数据 字典 


在 收集 数据 和 创建 规范 化 表 的 过 程 中 ， 一 定 要 维护 一 个 数据 字典 记录 数据 域 和 你 所 做 的 各 
种 假设 。 数 据 字 典 或 数据 仓库 由 元 数据 组 成 ， 元 数据 是 描述 存储 在 数据 库 中 数据 的 数据 。 它 
一 般 列 出 所 有 的 表 、 列 、 数 据 域 和 假设 。 将 此 数据 存在 记事 本 中 也 可 以 ， 但 存储 在 计算 机 中 
更 容易 组 织 。 有 些 设计 者 创建 一 个 单独 的 数据 库 来 记录 底层 的 项 目 数据 。 特 殊 的 计算 机 工具 
如 计算 机 辅助 软件 工程 (CASE) 工具 有 助 于 软件 设计 的 展开 。 它 们 的 用 处 之 一 是 创建 、 存 储 
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和 搜索 一 个 综合 的 数据 字典 。 


Bicycle (SerialNuyumber, Model, Construction, FrameSize, 
TopTube, ChainStay, HeadTube, SeatTube, PaintIiD, ColorStyle, 
CustomName, LetterStyle, EmpFrame, FEmpPaint, BuildDate, 
ShipDate) 

Paint (PaintID, ColorList) 

BikeTubes (SerialNumber, TubeID, Quantity) 

TubeMaterial (TubeIDp, Type, Material, Description) 

BikeParts (SerialNuyumber, ComponentID, SubstID， Quantity, 
DateInstalled, EmpInstalled) 

Component (Componentip, ProductNumber, BikeType, Category, 
Length, Height, Width, Weight, ListPprice, Description, QOH, 
ManufacturerID) 

PurchaseOrder (PurchaseliD, PODate, EmployeeID， ManufacturerID, 
ShipReceiveDate, ShippingCost, Discount) 

PurchaseItem (PurchaseIDp, CempenentID， Quantity, PricePaid， 
ReceivedQuantity) 

Employee (EnploveeID， FirstName, LastName) 

Manufacturer (ManufacturerID, Name, Contact, Address, Phone, 
CityID, ZipCode, CurrentBalance) 








ManufacturerTransaction (ManufacturerlD, TransactionDate, 
EmployeeID, Amount, Description, Reference) 
City (CityID, City, State, ZipCode, AreaCode) | 





图 3-58 完整 的 表 。 重 复 表 已 经 合并 ， 规 范 化 (4NF) 已 经 进行 了 验证 。 另 外 ， 
绘制 一 张 类 图 以 确保 表 能 够 连接 到 一 起 。 注 意 ， 附 加 的 Reference 列 存 
储 相应 的 PurchaseID 作 为 查账 索引 。 注 意 ， 有 些 表 (例如 ，Employee) 
将 来 还 需要 附加 数据 


3.13.1 DBMS 表 定义 


在 定义 好 多 辑 表 并 了 解 所 有 列 的 域 之 后 ， 你 可 以 将 这 些 表 输入 到 DBMS 中 。 大 部 分 系统 具 
有 图 形 用 户 界面 ， 方 便 表 的 定义 。 但 是 ， 在 有 些 情况 下 ， 你 可 能 不 得 不 使 用 第 4 章 介绍 的 SQL 
数据 定义 命令 。 两 种 情况 下 ， 流 程 是 相似 的 。 定 义 表 名 ， 输 入 列 名 ， 为 列 选 择 数据 类 型 ， 然 
后 确定 主 码 。 有 时 主 码 通过 创建 单独 的 索引 来 定义 。 有 些 系统 允许 你 为 每 列 和 每 张 表 创 建 描 
述 。 这 些 描述 可 能 包含 对 用 户 的 指导 ， 也 可 能 是 你 的 数据 字典 的 扩展 ， 来 帮助 设计 者 在 将 来 
进行 修改 。 

此 时 ， 你 应 当 决 定 哪些 主 码 希 望 使 用 自动 标识 函数 生成 。 类 似 地 ， 确 定 需要 计算 的 列 并 指 
出 它们 所 需 的 计算 公式 。 有 些 数 据 库 允许 将 这 些 计算 公式 与 数据 库 定义 存储 在 一 起 ， 对 于 其 
他 的 数据 库 ， 需 要 将 它们 写 到 查询 语句 中 。 

你 还 可 以 为 每 列 设置 默认 值 来 加 速 数据 输入 。 在 音像 店 的 例子 中 ， 可 以 设置 一 个 基本 租金 
的 默认 值 。 默 认 值 对 于 日 期 尤其 有 用 。 大 部 分 系统 允许 为 日 期 设 定 一 个 默认 值 ， 自 动 输入 当 
前 的 日 期 。 此 时 ， 你 还 应 当 设 置 验证 规则 以 强制 数据 完整 性 。 表 定义 一 结束 ， 你 就 可 以 设 定 
关系 。 在 Microsoft Access 中 ， 进 入 关系 界面 ， 添 加 所 有 表 ， 然 后 画 线 来 显示 连接 (很 像 类 图 )。 
一 定 要 选择 选 复 选 框 ， 表 示 “ 强 制 参 照 完整 性 ”",“ 级 联 删 除 ” 和 “级 联 更 新 ”。 在 SQL Server 
和 Oracle 中 ， 在 定义 表 的 时 候 可 以 把 参照 完整 性 指定 为 约束 。 
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图 3-59 显 示 了 Microsoft Access 用 于 定义 表 的 表单 。 主 码 的 设 定 可 以 通过 选择 适当 的 行 然 
后 点 击 图 标 来 完成 。 数 据 类 型 的 详情 诸如 字符 长 度 和 数据 子 类 型 等 ， 可 以 在 表单 底部 的 列表 
中 设 定 。 任 何 时 候 都 可 以 修改 表 。 如 果 表 中 已 经 有 数据 ， 当 你 选择 一 个 范围 较 小 的 数据 类 型 
时 可 能 会 丢失 某 些 信息 。 


表 Animal : Table 


Assigned by supplier or by store, might beblank } 
|Type of animal (bird, cat, dog, etc) 
Breed of animal (abrador . a 
rent dete artnal wos Dorn ag Be 
‘Male or Female or Unknown 
|Registered as pure bred 
;Generic description of color __ es 
/The price we want to get_ - 二 
_ | Can eventually hold the photo of the animal — i 
|For YBJADO and Web sites, the file name of the image ] 
IHTML pixel height _ 衣 
IHTML Dixel width 
Field Properties 





Yes (No Duplicates) A figld name can be up to 64 
ef, he 3 racters 
spaces. PressF1 for help on 
field names, 





图 3-59 Microsoft Access 中 的 表 定义 。 注 意 主 码 指示 符 。 另 外 注意 ， 文 本 大 小 
和 数字 的 子 类 型 定义 在 表单 底部 的 列表 中 

图 3-60 显 示 了 Oracle 中 用 于 创建 表 的 表单 ， 即 Schema Manager。 使 用 Constraints 标 签 可 以 
设置 主 码 和 外 码 。 记 住 ， 一 旦 在 Oracle (和 SQL Server) 中 创建 了 一 张 表 ， 以 后 将 很 难 改变 。 
它 人 允许 添加 新 列 ， 但 可 能 不 允许 你 修改 已 有 列 的 数据 类 型 或 删除 列 。 

如 果 使 用 版 本 号 等 于 或 高 于 8 的 Oracle， 一 旦 完成 建 表 ， 你 可 以 执行 额外 的 一 个 步骤 来 让 
Oracle 分 析 表 。 例 如 ， 使 用 SQL Plus 工具 执行 的 命令 类 似 于 : Analyze table Animal compnute 
statistic。 这 些 命令 告诉 Oracle 为 每 张 表 生成 统计 信息 (注意 Schema Manager 中 的 Statistics 标 签 )。 
Oracle 使 用 这 些 统计 信息 能 够 显著 提高 查询 的 性 能 。 

图 3-61 显 示 了 SQL Server 用 于 创建 和 编辑 表 的 表单 。 基 本 的 设计 与 Micorsoft Access 所 使 用 
的 类 似 。 但 关系 和 约束 在 Properties 表 单 上 指定 。 主 设计 表单 由 Enterprise Manager 激 活 ， 后 者 
列 出 了 数据 库 和 其 中 所 有 的 表 。 

很 容易 看 出 各 种 数据 库 设 计 产 品 的 相似 之 处 ， 而 系统 之 间 重要 的 区 别 在 于 各 系统 内 部 使 用 
的 数据 类 型 。 虽 然 有 些 数 据 类 型 名 称 相 似 ， 但 是 特别 要 小 心 Oracle 数 据 库 。 它 的 底层 数据 类 型 
对 于 Oracle 和 SQL Server, 图 形 表单 似乎 容易 使 用 ， 但 是 ， 
有 经 验 的 开发 者 几乎 总 是 依靠 存储 在 文本 文件 中 的 SQL 语句 来 创建 表 。 图 3-62 给 出 了 Animal 表 
的 示例 。 你 可 以 建立 所 有 表 的 创建 语句 并 将 它们 存储 在 一 个 文本 文件 中 。 数 据 库 的 SQL 处 理 器 
阅读 此 文件 并 创建 表 。 文 本 文件 相 比 图 形 界面 方法 具有 很 多 优点 : (1) 修改 文本 文件 更 容易 。 
(2) 在 不 同 数据 库 或 不 同 计算 机 中 重新 建 表 更 容易 。(3) 修改 表 的 定义 通常 需要 创建 新 表 ， 找 





108 第 一 部 分 系统 设 矿 





Oracle Schema Manager 


ORACLE 


申明 AUTONUMBER 
UyBREED 
ACATEGORY 


|<None> 
十 





中 全 CUSTOMER ” 恒 
外 国 CUSTOMERACC 党 
中 拉 EMPLOYEE 。 剖 
中 位 MERCHANDISE 属 


' 
1Properties 


本 





图 3-61 Microsoft SQL Server 中 用 于 创建 表 的 表单 。 注 意 它 与 Microsoft Access 
设计 表单 的 相似 性 ， 但 是 关系 和 约束 在 Properties 表 单 中 指定 
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贝 已 有 数据 ， 删 除 旧 表 和 重 命名 新 表 。 使 用 文本 文件 ， 可 以 快速 定义 新 表 并 执行 语句 创建 新 表 。 
(4) 使 用 文本 文件 更 容易 设 定 主 码 和 外 码 关系 。 大 多 数 图 形 方 法 笨重 而 且 难 懂 。 而 有 全， 有 些 版 
本 的 Oracle 对 使 用 图 形 界面 具有 限制 ， 而 通过 直接 使 用 SQL 语句 则 可 以 避免 这 些 限 制 。(5) 由 
于 外 码 约 束 ， 创 建 表 的 顺序 是 至 关 重 要 的 。 必 须 先 创建 一 个 表 ， 然 后 才能 在 外 码 中 引用 它 。 例 
如 ，Category 表 和 Breed 表 必须 在 创建 Animal 表 之 前 创建 。 在 文本 文件 中 记录 表 的 定义 意味 着 你 
只 需 一 次 设 定 次 序 即 可 。 如 果 你 对 SQL 的 建 表 语 法 不 熟悉 ， 可 以 查看 已 有 的 结构 文件 ， 或 使 用 
Schema Manager 输 入 基本 信息 ， 然 后 点 击 Show SQL 按钮 , 剪 切 并 粘贴 基本 的 SQL 代码 。 


CREATE TABLE Animal 

( 

AnimalID INTEGER, 

Name VARCHAR2 (50) ， 

Category VARCHAR2 (50) ， 

Breed VARCHAR2 (50) ， 

DateBorn DATE, 

Gender VARCHAR2 (50) 
CHECK (Gender=’Male’ Or Gender=’'Female’ 

Or Gender=’Unknown’ Or Gender Is Null) 

Registered VARCHAR2 (50) ， 

Color VARCHAR2 (50) ， 

ListPrice NUMBER(38,4) 
DEFAULT 0， 

Photo LONG RAW, 

ImageFile VARCHAR2 (250) ， 

ImageHeight INTEGER, 

ImageWidth INTEGER, 
CONSTRAINT pk_Animal PRIMARY KEY (AnimalID) 
CONSTRAINT fk BreedAnimal FOREIGN XEY (Category, Breed) 
REFERENCES Breed(Category, Breed) 
ON DELETE CASCADE 

CONSTRAINT fk CategoryAnimal FOREIGN KEY (Category) 
REFERENCES Category (Category) 
ON DELETE CASCADE 





图 3-62 创建 Animal 表 的 Oracle SQL 语句 。 用 于 SQL Server 的 语句 与 此 类 似 ， 
只 需 修 改 数据 类 型 
创建 Oralce 表 时 ， 和 需要 知道 另外 一 个 关键 的 功能 。 一 旦 完成 建 表 ， 需 要 让 Oracle 对 表 进 行 
分 析 并 收集 关于 该 表 的 统计 信息 。 首 先 ， 使 用 SQL 建 表 。 第 二 ， 向 表 中 装载 现 有 数据 。 第 三 ， 
使 用 SQL Plus 工具 为 每 张 表 执 行 分 析 命令 。 例 如 :， Analyze table Animal compite statistics 。 


3.13.2 数据 量 与 使 用 率 


设计 数据 库 的 下 一 步 是 估算 数据 库 的 大 小 。 这 个 过 程 比较 简单 ， 但 必须 向 用 户 询问 很 多 问 
题 。 设 计 一 个 数据 库 时 ， 估 算数 据 库 的 大 小 和 使 用 率 是 很 重要 的 。 估 算 的 结果 能 使 你 估计 硬 
件 需求 和 系统 的 成 本 。 第 一 步 是 估算 表 的 大 小 。 一 般 来 说 ， 需 要 调查 三 种 情形 ; 数据 库 现在 
多 大 ? 2~3 年 后 数据 库 会 多 大 ?10 年 后 数据 库 会 多 大 ? 
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从 规范 化 表 开始 。 这 个 过 程 包括 估算 表 中 每 行 的 平均 字 节 数 和 估算 表 中 的 行 数 。 将 这 两 个 
数 相 乘 ， 得 到 表 大 小 的 估算 值 ， 然 后 将 所 有 表 的 规模 相 加 ， 得 到 数据 库 总 规模 的 估算 值 。 这 
个 数字 代表 数据 库 的 最 小 规模 。 很 多 数据 库 会 比 这 个 基本 估算 值 大 3 到 5 倍 。 有 些 系统 具有 更 
复杂 的 规则 和 估算 流程 。 例 如 ，Oracle 提 供 了 一 个 工具 来 帮助 估计 数据 库 所 需 的 存储 空间 。 仍 
从 每 列 的 数据 类 型 和 近似 的 行 数 开始 。 这 个 工具 使 用 关于 Oracle 流 程 的 内 部 规则 来 辅助 估算 所 
需 的 总 存储 空间 。 

一 个 估算 数据 量 的 例子 如 图 3-63 所 示 。 考 虑 Customer 表 。 数 据 库 系统 为 每 列 数据 留 出 一 定 
大 小 的 存储 空间 。 这 个 值 取决 于 特定 系统 ， 因 此 请 参考 文档 以 得 到 精确 的 值 。 在 简化 的 
Customer 表 中 ， 长 整 型 的 标识 数字 占 4 字 节 ， 估 计 Names 平 均 占 15 字 符 。 其 他 平均 值 显示 在 表 
中 。 更 好 的 估算 可 从 对 示例 数据 的 统计 分 析 获 得 。 无 论 如 何 ， 每 行 Customer 数 据 的 估算 值 是 
76 字 节 。 估 计 此 业务 拥有 大 约 1 000 个 客户 。 因 此 ，Customer 表 约 为 76K 字 节 。 


Cem C#, Name, Address, City, State, ZIP) 
Row: 4+15 + 25 + 20+ 2 +10 =76 


Order(O#, C#, Odate) 
Row: 4+4+ 8 =16 


Orderltem(O#,_P#, Quantity, SalePrice) 
Row: 4+4 + 4 + 8 = 


Ordersin 3 yrs = 1,000 Customers * Ia -Orders *3 yrs=30,000 
Orderltem = 30,000 Orders » -3 Lines = 150,000 
业务 规则 : 2 让 omer 76 * 1,000 76,000 


16*30,000 480,000 
20 150,000 过 过 
fm 





图 3-63 估算 数据 量 。 首 先 估算 每 行 的 大 小 ， 然 后 估算 表 中 的 行 数 。 如 果 存 在 连 

接 码 ， 通 常会 用 平均 值 乘 以 主 码 表 中 的 行 数 ， 就 像 计 算 OrderItem 一 样 
对 Order 表 大 小 的 估算 遵循 类 似 的 过 程 ， 得 到 的 估算 结果 是 每 行 16 字 节 。 经 理 可 能 知道 某 1 
年 的 订单 数目 。 但 是 ， 可 能 更 容易 获得 某 1 客 户 1 年 内 的 平均 订单 数 。 如 果 这 个 数 是 10， 那 么 
你 可 以 认为 1 年 会 有 10 000 个 订单 。 类 似 地 ， 要 获取 OrderItem 表 中 的 行 数 ， 需 要 了 解 平 均 每 张 
订单 订购 的 产品 数目 。 如 果 那 个 数 是 5， 那 么 ， 可 以 认为 1 年 后 OrderItem 表 将 会 有 150 000 行 。 
下 一 步 是 估计 数据 存储 的 时 间 长 度 。 一 些 公司 计划 将 数据 联机 保存 多 年 ， 而 另 一 些 则 遵循 
严格 的 保留 和 删除 策略 。 合 法 用 途 的 数据 必须 保存 一 定年 份 ， 由 它 的 种 类 决定 a 记 住 ， 诸 如 

IRS 等 代理 还 要 求 还 原 软件 (例如 DBMS) 能 够 重建 数据 。 

除了 基本 的 数据 存储 ,数据 库 还 要 为 索引 、 日 志文 件 、 表 单 、 程 序 和 备份 数据 保留 空间 。 
拥有 特定 数据 库 系 统 的 经 验 将 提供 更 具体 的 估计 , 但 最 终 的 总 计 可 能 是 基本 估计 大 小 的 3~5 倍 。 
最 终 的 估计 结果 对 支持 数据 库 所 需要 的 硬件 提供 参考 意见 。 尽 管 性 能 和 价格 在 不 断 变 化 ， 
仍然 只 有 小 型 数据 库 能 够 在 个 人 计算 机 上 高 效 运行 。 较 大 的 数据 库 可 以 放 到 局 域 网 (LAN) 
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内 的 一 台 文件 服务 器 上 。LAN 提 供 数 据 的 多 用 户 访问 ， 但 性 能 很 大 程度 取决 于 数据 库 的 大 小 ， 
DBMS 的 特征 以 及 网 速 。 随 着 数据 库 规模 的 增长 〈 几 百 或 几 千 兆 字 节 )， 有 必要 转移 到 专门 的 
计算 机 来 处 理 数据 。 超 大 规模 数据 库 (万 亿 字 节 ) 需要 多 台 计算 机 和 特殊 的 磁盘 驱动 器 来 将 
容量 和 性 能 瓶颈 最 小 化 。 数 据 估算 不 必 非 常 精确 ， 但 它们 能 提供 基本 的 信息 给 计划 委员 会 以 
便 申请 用 于 开发 、 硬 件 、 软 件 和 人 员 的 资金 。 

当 与 用 户 谈论 每 张 表 时 ， 应 当 让 他 们 指出 一 些 基 本 的 安全 信息 。 你 最 后 需要 赋予 每 张 表 安 
全 访问 的 权限 。 第 10 章 将 具体 介绍 ， 但 目前 应 该 搞 清 楚 哪些 人 使 用 表 ， 以 及 哪些 人 不 应 当 授 
予 某 些 权力 。 例 如 ， 订 购 商品 的 职员 不 应 允许 确认 接收 该 商品 。 否 则 ， 一 位 不 道德 的 职员 会 
订购 商品 ， 确 认 接 收 ， 然 后 偷 走 它 。 可 允许 数据 四 种 基本 操作 : 读 取 、 修 改 、 删 除 或 添加 新 
数据 。 应 当 记 录 谁 可 以 或 不 可 以 访问 某 张 表 。 


小 结 


数据 库 设 计 依 赖 规范 化 或 将 数据 划分 到 表 的 过 程 。 基 本 上 ， 每 张 表 涉 及 一 个 单独 的 实 
体 或 概念 。 每 张 表 必须 拥有 能 惟一 标识 每 行 数据 的 主 码 。 你 从 数据 的 集合 开始 建 表 ， 数 据 
集合 一 般 由 用 户 表单 或 报表 得 到 。 通 过 寻找 数据 中 的 重复 组 并 将 它们 放 到 一 个 单独 的 表 中 ， 
就 可 以 满足 1INF 的 要 求 。 接 着 ,遍历 每 张 中 间 表 ， 确 定 主 码 。 通 过 检查 每 个 非 主 码 列 并 判 
断 它 是 否 依赖 于 整个 主 码 来 满足 2NF 的 要 求 。 如 果 不 依赖 于 整个 主 码 ， 就 将 这 列 连同 它 所 依 
赖 的 部 分 主 码 移 出 放 入 一 个 新 表 。 要 达到 3NF， 检 查 每 个 非 主 码 列 是 否 依 赖 于 任何 非 主 码 的 
列 。 如 果 是 这 样 ， 那 么 将 此 列 和 它 所 依赖 的 列 移 到 一 个 新 表 中 。BCNF 和 4NF 涉 及 主 码 当 中 
的 类 似 问题 。 特 别 希望 查找 主 码 中 的 隐 含 依赖 。 如 果 找 到 了 ， 则 创建 一 个 新 表 使 这 种 依赖 
显 式 化 。 

从 用 户 那里 收集 的 每 个 表单 、 报 表 或 描述 ， 必 须 进行 分 析 并 推导 得 到 满足 4NF 的 表 定 义 集 
合 。 对 于 大 型 项 目 ， 若 干 分 析 师 可 能 分 析 不 同 的 表单 ， 产 生 若 干系 列 规范 化 的 表 。 这 些 表 必 
须 集 成 为 一 个 标准 的 规范 化 表 的 集合 。 在 这 个 过 程 中 必须 为 每 一 列 指定 域 或 者 数据 类 型 。 这 
些 最 终 的 表 连 同 注释 将 输入 到 DBMS 中 ， 以 创建 数据 库 。 

还 应 当 根据 每 张 表 的 行 数 对 数据 量 进行 估算 。 这 些 数字 使 你 能 够 估算 数据 库 的 平均 大 小 和 
最 大 规模 ， 以 便 你 能 选择 适当 的 硬件 和 软件 。 还 应 当 收集 关于 安全 条 件 的 信息 : 谁 拥有 数据 ? 
谁 可 以 进行 读 访问 ? 谁 可 以 进行 写 访问 ? 所 有 这 些 条 件 都 在 创建 表 的 时 候 输 入 到 DBMS 中 。 

在 回顾 你 的 工作 时 ， 可 以 输入 示例 数据 来 测试 你 的 表 。 当 确定 设计 完整 和 精确 之 后 ， 就 可 
以 通过 创建 查询 、 表 单 和 报表 来 建立 应 用 了 。 
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关键 词 
自动 标识 删除 异常 插入 异常 
Boyce-Codd 范 式 (BCNF) 依赖 主 从 关系 
级 联 删除 域 - 码 范式 (DKNF) 参照 完整 性 
复合 码 第 一 范式 (1NF) 重复 组 
数据 字典 /仓库 外 码 第 二 范式 (2NF) 
数据 完整 性 第 四 范式 (4NF) 第 三 范式 (3NF) 
数据 量 默认 值 隐 含 依赖 
元 数据 

复习 题 


1. 什么 是 主 码 ， 为 什么 需要 它 ? 

2. 什么 是 复合 码 ? 

3. 规范 化 的 主要 规则 是 什么 ? 

4. 如 果 数 据 没有 存储 到 规范 化 的 表 中 ， 会 遇 到 什么 问题 ? 
5. 解释 短语 : 表 中 的 一 列 依赖 于 另 一 列 。 

6. BCNF 和 4NF 如 何不 同 于 3NF? 

7. 能 够 存储 到 表 中 的 主要 数据 类 型 是 什么 ? 
8. 给 出 一 个 作为 数据 完整 性 存储 规则 的 例子 。 
9. 当 集 成 视图 时 需要 寻找 什么 元 素 ? 

10, 如 何 估算 数据 库 的 潜在 规模 ? 

11. 参照 完整 性 为 什么 很 重要 ? 

12. 设置 参照 完整 性 规则 会 引起 什么 复杂 情况 ? 


练习 

1. 本 地 一 家 零售 商店 正在 建立 一 个 网 站 ， 想 请 你 创建 一 个 数据 库 用 来 记录 需求 信息 。 公 司 想 
收集 基本 客户 数据 ， 当 用 户 反馈 对 主题 发 表 评 论 时 进行 记录 。 主 题 是 预先 定义 好 的 项 目 列 
表 (经 理 可 以 修改 )， 用 户 可 以 通过 选择 框 进行 选择 。 为 这 个 项 目 定义 需要 的 规范 化 表 。 
为 此 例 创建 类 图 和 规范 化 的 表 。 


Name 

Phone 

E-mail 
Address 

City, State ZIP 
Country 


Date/Time ip Address Comment Topic 
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2. 你 被 雇用 来 为 公司 开发 一 个 小 型 数据 库 以 提供 公司 产品 的 网 上 销售 。 为 此 例 创建 类 图 和 规 
范 化 的 表 。 


Name| Shipping Address [cd# Em | 
ltems 
ame | escrption tist | Saie | Quantity 四 本 虽 
Description | Quantity | Price | Price | Shipped | Order | Extended 

| 
| 
| 
加 

































litem Total 
Shipping 
Tax 

Total Due 








3. 本 地 一 家 公司 的 人 力 资源 部 分 需要 帮助 。 经 理想 要 为 员工 提供 自助 类 型 的 福利 ， 使 雇员 可 
以 选择 他 们 想 要 的 福利 组 合 。 公 司 出 固定 数量 的 钱 ， 如 果 所 选项 超过 限制 ， 雇 员 需 要 支付 
差价 。 人 力 资源 部 门 还 希望 记录 每 个 雇员 工作 的 列表 。 当 前 ， 这 些 信 息 通 过 与 下 图 相似 的 
表单 来 收集 。 为 此 例 创建 类 图 和 规范 化 的 表 。 


Employee 

Last Name, First Name 
Office, Phone 

Date Hired 


Benefit Date Monthly Cost 


Job/Title Location Start Date End Date Salary Supervisor 





4. 你 的 朋友 开 了 一 家 车 库 乐 队 。 乐 队 已 经 写 了 若干 首 歌 并 且 在 多 家 夜总会 演出 。 为 改进 演出 
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和 乐队 ， 她 想 要 一 个 数据 库 来 记录 演奏 了 哪些 歌 和 大 家 的 反响 如 何 。 乐 队 成 员 也 想 记录 每 
首 歌 是 谁 演奏 的 并 指出 是 否 存 在 问题 (或 优点 ) 以 便 他 们 知道 该 做 什么 。 数据库 必 须 易 用 ， 
她 草拟 了 一 张 示例 表单 。 为 此 例 创建 类 图 和 规范 化 的 表 。 


Gig 
Date Location 
Start Time End Time 
# People Money 
Comments 


Song Person Instrument Comment 
Length Actual 
Author 


Style Key 
Comments 


Song Person Instrument Comment 
Length Actual 

Author 

Style Key 

Comments 





5. 一 家 草坪 护理 公司 需要 记录 客户 的 任务 及 雇员 。 现 在 ， 店 主将 每 天 的 记录 记 在 一 者 纸 上 。 
与 这 里 所 示 的 表单 类 似 ， 它 根据 时 间 列 出 工作 。 雇 员 可 以 为 每 位 客户 完成 多 项 任务 ， 包 括 
割 草 、 修 边 和 剪 枝 。 为 此 例 创建 类 图 和 规范 化 的 表 。 


Lawn Care 
Date 


Time Customer, Address Total 
Task Employee Time Charge 






6. 本 地 一 家 乡村 俱乐部 拥有 漂亮 的 新 俱乐部 会 所 ， 它 出 租 给 个 人 或 公司 用 于 小 型 聚会 或 招 
待 会 。 俱 乐 部 会 所 有 四 个 不 同 大 小 的 房间 ， 可 以 单独 出 租 ， 但 经 理 一 般 不 喜欢 同时 承接 
两 个 以 上 大 型 活动 。 客 户 必 须 提 前 预订 ， 然 后 根据 预计 客人 数量 选择 房间 。 客 户 可 以 选 
择 点 餐 或 吃 自助 餐 。 餐 费 取 决 于 所 点 的 项 目 。 如 示例 表单 ， 只 要 另 付费 用 ， 客 户 可 以 选 
择 停 车 服务 和 俱乐部 提供 的 鲜花 。 酒 吧 服 务 与 用 餐 选项 类 似 。 为 此 例 创建 类 图 和 规范 化 
的 表 。 
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Reservation Form 
Employee 
Maximum Capacity 


Date 
Room/Hall 


Cancel Date 
Total Due 
Deposit 


Event Date, Time, Length 
Event Titie 

口 Valet Parking (cost: ) 
口 Flowers (cost: ) 


# Guests 
Menu 
Cost 


Lunch (sit down) # Servers 


ltem Description Subtotal 


Quantity 


# Guests 
Menu 
Cost 


Dinner (sit down) # Servers 


lttem 


Buffet ... 
Bar ... 


Description Quantity Subtotal 





7. 一 家 小 型 木工 店 专门 制造 大 座 钟 。 这 家 店 从 不 同 的 供应 商 那里 订购 木材 、 发 条 和 其 他 零 部 件 。 
木板 经 过 人 刨 平 粗 木 、 上 胶 、 成 型 和 装配 得 到 。 顶 部 的 装饰 雕刻 从 一 个 单独 的 供应 商 那 里 购买 ， 
在 那里 用 手工 完成 这 些 雕 刻 。 有 些 钟 表 由 客户 订购 ， 客 户 可 以 选择 诸如 高 度 和 发 条 等 。 对 于 
一 般 的 订单 ， 店 主 通常 填写 与 图 中 所 示 相 似 的 表单 来 进行 记录 。 时 钟 供不应求 ， 店 主 故意 限 
量 生产 ， 因 此 价格 一 直 很 高 。 根 据 订 单 和 销售 表单 ， 为 此 例 创建 类 图 和 规范 化 的 表 。 注 意 ， 
Sale 表 单 上 的 项 目 总 计 不 等 于 总 金额 ， 因 为 总 金额 还 要 包括 一 些 额外 的 费用 ， 但 不 包括 邮费 。 
尽管 在 表单 中 没有 显示 ， 店 主 还 希望 记录 每 个 时 钟 开始 制造 和 完成 制造 的 日 期 。 


Sale 





Order Date 
Estimated Delivery Date 
Actual Delivery Date 


Total Price 
Delivery Method 


Payment Method 
Delivery Charge 


Color Quantity 


ltem/Feature 


Price 





Customer 
Phone 
Address 

City, State ZiP 


Subtotal 


ttern Total 
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Purchase Order 
Supplier Order Date 
Contact Phone Employee 
Estimated Ship Date 
Date Received 


ltem Quantity Cost Quantity Received Clock (custom orders) 


Total Charges Date Due 
Date Paid Amount Paid 





8. 本 地 一 家 比萨 店 需要 一 个 数据 库 记 录 客 户 订购 和 送 货 信息 。 基 本 的 订购 表单 和 比萨 送 到 时 
司机 需要 填写 的 一 张 表 单 如 下 图 所 示 。 司 机 被 鼓励 记 下 用 户 关于 送 货 的 评论 或 订单 ， 对 下 
次 送 餐 的 司机 可 能 有 用 。 必 须 记录 小 费 ， 因 为 他 们 要 向 IRS 报 告 。 为 此 例 创建 类 图 和 规范 
化 的 表 。 


Pizza Order 
Customer Order Date/Time 
Phone Employee 
Address 


For each pizza: 
Crust Type 
Size 
Base Price 
Specialty Pizza 
Custom Toppings 
Comments (e.g., half/half) 


Topping Cost 
Tax 
Discount/Coupon 
Total 
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Delivery Time 
Employee 
Directions 


Payment Method Credit Card # Expiration 
Driver Tip 
Comments (e.g., dog) 





9. 一 家 制造 动画 片 的 公司 想 要 你 建立 一 个 数据 库 记 录制 作 动画 片 的 过 程 。 依 据 附带 的 表单 ， 
工作 主要 集中 在 记录 单独 的 角色 和 场景 上 。 首 席 美 工 绘制 一 种 角色 并 将 基本 数据 进行 存储 ， 
以 便 其 他 美工 可 以 获取 并 在 他 们 的 场景 中 应 用 。 公 司 还 要 求 员 工 记 录制 作 各 种 场景 所 需 的 
时 间 。 为 此 例 创建 类 图 和 规范 化 的 表 。 


Character 
Name Artist in Charge 
Description 
Relative Size 


Character Views: digitized and stored 





Sequence/Position 
Lead Writer 
Synopsis 


Character 
View 

Rote 

Action 
Description 


Work Status 
Employee 


Scene Character Changes/Work Amount of Time 
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10. 一 家 制作 带 设 计 师 签名 的 牛仔 裤 的 公司 遇 到 了 困难 。 经 理 需 要 让 生产 和 订购 数量 相 匹配 ， 
并 且 确 保 产 品 按时 发 给 客户 。 由 于 每 种 款式 的 牛仔 裤 会 有 很 多 种 尺寸 ， 而 且 客 户 有 很 特殊 
的 订单 ， 因 此 问题 变 得 更 加 困难 。 订 单 可 能 会 很 大 ， 通 常 由 多 家 制造 三 共同 完成 ， 因 此 完 
成 一 个 订单 需要 多 次 送 货 。 订 单 、 送 货 单 和 生产 表单 显示 了 所 需 的 主要 项 目 。 每 家 制造 厂 


有 多 道 工 序 。 一 条 生产 线 包 括 大 约 5 个 雇员 ， 完 成 牛仔 裤 的 不 同 部 分 。 为 此 例 创建 类 图 和 
规范 化 的 表 。 


Order 
Order Date 
Exp. Detivery Date 


Order iD 
Customer PO 
Customer Contact Phone 


List Price Sale Price Value 


Order Total 


Delivery 
Order iD 
Factory: Location Manager 
Shipping Costs 


Color 


Delivery Date 


Factory Production 


Address Maximum Capacity 


City, State ZIP 


Country Date 


Gender Quantity Defective Hours 


# People 





Sally 的 宠物 商店 

11. 定义 需要 的 表 扩 展 宠物 商店 数据 库 以 处 理 动物 的 谱系 记录 。 

12. 定义 需要 的 表 扩 展 宠物 商店 数据 库 以 处 理 动物 的 健康 和 兽医 的 记录 。 
13. Sally 想 在 数据 库 中 增加 薪水 和 月 度 雇员 评价 信息 。 定 义 需 要 的 表 。 
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14. Sally 想 添加 完 物 训练 服务 。 定 义 记录 预约 计划 所 需 的 表 ， 假 设 有 两 个 员工 负责 这 项 
工作 。 

Rolling Thunder 自 行车 

15. 使 用 类 图 ， 指 出 表 定 义 和 表 关系 所 描述 的 五 种 业务 规则 (与 音像 店 示例 中 描述 的 RentPrice 
规则 相似 )。 

16. 公司 想 为 人 力 资 源 添 加 更 多 的 数据 ， 诸 如 扣 税 、 所 选 福利 以 及 雇员 和 公司 对 福利 的 支付 情 
况 。 研 究 处 理 这 种 类 型 数据 的 通用 方法 ， 定 义 所 需要 的 表 。 


参考 网 站 
网 站 描述 
http://www.intelligententerprise.com/info_centers/database 数据 库 杂 志 
http:Wwww.forgov.bc.cayisb/datadmin/ Canadian Ministry of Forests 
数据 管理 网 站 ， 有 很 多 关于 
数据 管理 和 设计 的 有 用 信息 。 
从 开发 标准 开始 。 


http://support.microsoft.com/support/kb/articles.q209/5/34.asp 规范 化 的 介绍 
http://www.phpbuilder.com/columns/barry20000731.php3 规范 化 示例 
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presentation of normalization with examples.] 
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business applications.] 
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附录 : 规范 化 的 形式 化 定义 


关系 数据 库 模 型 的 优点 之 一 是 从 集合 论 的 数学 基础 上 发 展 而 来 。 尽 管 不 需要 了 解 形式 化 的 
定义 ， 但 有 时 能 使 你 更 好 地 理解 整个 过 程 。 要 更 详细 地 了 解 范式 及 其 复杂 性 ， 应 当 阅 读 C. 丁 . 
Date 的 高 级 教程 。 记 住 ， 形 式 化 定义 使 用 专业 术语 。 图 3-1A 列 出 了 主要 术语 和 它们 的 一 般 解 
释 。 尽 管 形式 化 术语 更 精确 ， 但 很 少 有 人 对 术语 有 标准 的 理解 ， 因 此 ， 在 大 部 分 交流 中 使 用 
非 形式 化 术语 更 好 一 些 。 


La 


Relation 数据 随时 间 不 断 变化 的 属性 集合 。 通 常 记 作 R 


形式 化 
EE 
dependency dependency 


图 3-1A 术语 。 形 式 化 术语 更 精确 并 且 有 数学 上 的 定义 ， 但 是 很 难 让 开发 者 和 
用 户 理解 


非 形式 化 


















Row of data 





1 初始 定义 


关系 是 数据 随时 会 改变 的 属性 集合 。 每 个 属性 具有 相应 的 域 并 且 涉 及 现实 世界 中 的 某 种 特 
性 。 形 式 化 定义 指 属 性 的 子 集 ， 是 列 的 集合 。 属 性 X 的 特定 子 集 返 回 的 元 组 中 的 数据 值 记 为 {[X]。 

规范 化 的 本 质 是 承认 属性 集 具 有 某 些 现实 世界 的 关系 。 其 目标 是 精确 地 描述 这 些 关 系 约 
束 。 这 些 语 义 上 的 约束 称 为 函数 依赖 〈(FD ) 。 

(1) 定义 : 也 数 依赖 和 决定 因素 

若 X 和 Y 是 属性 的 子 集 ， 则 函数 依赖 记 为 X 一 Y， 当 任意 数据 行 具 有 相同 的 X 属 性 值 时 ， 总 
会 有 相同 的 Y 属 性 值 。 即 ， 对 于 关系 R 的 元 组 UL 和 纪 ， 如 果 tL[X]=t2[X]， 那 么 HL[Y]=t2[Y]。 在 
一 个 ED 中 ，X 也 称 为 决定 因素 ， 因 为 一 给 定 X 属 性 的 值 ， 根 据 依 赖 ， 就 能 确定 Y 的 属性 值 。 

主 码 对 于 关系 数据 库 很 重要 ， 因 为 它们 用 于 确定 数据 行 。 有 时 多 个 属性 的 集合 可 以 用 来 构 
成 不 同 的 主 码 ， 因 此 它 有 时 作为 候选 主 码 。 

(2) 定义 : 主 码 

主 码 是 属性 的 集合 K， 若 U 是 关系 中 所 有 属性 的 集合 ， 则 

1) 存在 一 个 函数 依赖 K 一 U 

2) 如 果 K' 是 K 的 子 集 ， 那 么 不 存在 FDK' 一 U 
即 ， 主 码 的 属性 集 K 能 在 函数 上 确定 关系 中 的 其 他 所 有 属性 ， 并 且 它 是 具有 这 种 关系 的 最 小 集 
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合 (不 存在 更 小 的 能 决定 其 他 属性 的 集合 K)。 
2 范式 定义 


第 一 范式 的 定义 与 原子 属性 的 定义 紧密 相关 ， 因 此 需要 同时 定义 。 

(1) 定义 : 第 一 范式 (1NF) 

一 个 关系 满足 第 一 范式 当 且 仅 当 它 的 所 有 属性 都 是 原子 的 。 

(2) 定义 : 原子 属性 

原子 属性 是 单独 赋值 的 ， 这 意味 着 不 能 是 复合 的 、 多 值 的 或 圣 套 的 关系 。 

本 质 上 ， 一 个 1NF 关 系 是 一 张 表 ， 它 的 每 一 属性 列 都 是 简单 的 单元 。 不 能 使 用 技巧 试图 向 
一 列 中 压 和 人 额外 的 数据 、 其 他 关系 或 者 多 个 列 。 图 3-2A 提 供 了 一 张 表 的 例子 ， 它 不 满足 第 一 
范式 ， 因 为 它 有 两 个 属性 不 是 原子 的 。 

第 二 范式 依据 主 码 和 函数 依赖 来 定义 。 

(3) 定义 : 第 二 范式 (2NF) 

一 个 关系 满足 第 二 范式 , 如 果 它 满足 第 一 范式 , 并 且 每 个 非 主 码 属性 完全 函数 依赖 于 主 码 。 
即 ， 对 于 每 个 非 主 码 属性 Ai， 有 K 一 Ai。 因 此 ， 不 存在 子 集 K'， 使 得 任何 属性 满足 K' 一 Ai。 

这 个 定义 与 本 章 介绍 的 简单 定义 相符 :每 个 非 主 码 列 依赖 于 整个 主 码 ， 而 不 是 主 码 的 一 部 
分 。 图 3-3A 显 示 了 一 个 不 满足 第 二 范式 的 关系 的 例子 。 


Customer(CID, Name: First + Last, Phones, Address) OrderProduct(OrderiD, ProductD, Quantity, Description) 





图 3-2A 非 原子 属性 。 沁 张 下 丰满 是 第 一 交 克 ， 图 3-3A 非 完全 依赖 ,产品 描述 只 依赖 于 ProductID， 
因为 Name 属 性 是 两 个 属性 元 素 的 组 而 非 整 个 主 码 {OrderID，ProductID)， 
合 ，Phones 属 性 用 来 处 理 多 个 值 此 这 个 关系 不 满足 第 二 范式 
三 范式 的 形式 化 定义 有 点 难 理解 ， 因 为 它 依赖 于 一 个 新 概念 ， 传 递 依赖 。 
(4) 定义 : 传递 依赖 
已 知 函 数 依 赖 X 一 Y 和 Y 一 Z， 则 传递 依赖 X 一 Z 也 成 立 。 
传递 的 概念 在 初等 代数 中 很 常见 。 它 起 源 于 集合 论 。 要 理解 这 个 定义 ， 需 要 记 住 ， 函 数 依 
赖 表示 业务 语义 关系 。 考 虑 OrderID 、Customer ID 和 客户 Name 属 性 之 间 的 关系 。 每 张 订 单 只 
能 有 一 个 客户 的 业务 规则 翻译 为 函数 依赖 是 OrderID 一 CustomerID 。 只 要 知道 OrderID 的 值 ， 
总 能 知道 CustomerID 的 值 。 同 样 ，CustomerID 和 其 他 属性 诸如 Name 之 间 的 主 码 关系 意味 着 存 
在 一 个 函数 依赖 CustomerID 一 Name。 根 据 传递 性 ， 只 要 知道 OrderID 的 值 ， 就 能 获得 
CustomerID 的 值 ， 进 而 得 到 客户 Name 的 值 。 
(5) 定义 : 第 三 范式 (3NF) 
一 个 关系 满足 第 三 范式 当 且 仅 当 它们 满足 第 二 范式 ， 并 且 没 有 传递 依赖 于 主 码 的 非 主 码 属 
性 。 即 ,已 知 第 二 范式 ， 对 于 每 个 属性 Ai 有 K 一 Ai， 那 么 不 存在 属性 子 集 X 使 得 K 一 X 一 Ai。 
用 简单 一 点 的 术语 ， 每 个 非 主 码 属 性 依赖 于 完整 的 主 码 ， 而 不 依赖 于 某 中 间 属 性 。 图 3-4A 
显示 一 个 普通 的 不 满足 第 三 范式 的 关系 示例 ， 因 为 客户 属性 传递 依赖 于 CustomerID 。 
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0rder(t0rderiD, 0rderDate, CustomeriD, Name, Phone) 











[riedD | orderbate | CustomerD [Nome [Phome | 
S/S/2004 | 2 |Hong |444-8888 | 








图 3-4A 传递 依赖 。 客 户 Name 和 Phone 属 性 传递 依赖 于 CustomerID， 因 此 这 个 
关系 不 满足 第 三 范式 

正如 第 3 章 讨论 的 ，Boyce-Codd 范 式 更 难 理解 。 它 和 形式 化 定义 表示 相同 的 基本 问题 : 移 
除 隐 含 依赖 。 

(6) 定义 : Boyce-Codd 范 式 (BCNF) 

一 个 关系 满足 Boyce-Codd 范 式 当 且 仅 当 它 满足 第 三 范式 ， 并 且 每 个 决定 因素 都 是 一 个 候 
选 主 码 。 即 ， 对 于 每 个 属性 都 有 K 一 Ai， 并 且 不 存在 子 集 X ( 主 码 或 非 主 码 ) 使 得 X 一 Ai 且 X 与 
KK 不 同 。 

如 图 3-5A 所 示 的 例子 ， 考 虑 雇员 有 很 多 专业 ， 每 个 专业 有 很 多 雇员 ， 而 且 一 个 雇员 可 以 
有 很 多 经 理 ， 但 每 个 经 理 只 是 一 个 专业 的 经 理 。 函 数 依赖 (ManagerID 一 Specialty) 不 是 关系 
EmpspecMgr (EID，Specialty，ManagerID ) 的 主 码 ， 因 此 ， 关 系 不 满足 BCNF。 必 须 分 解 ， 
创建 新 的 关系 ManagerSpecialty (ManagerID，Specialty) 和 EmployeeManager (EmployeelD， 
ManagerID) ， 新 关系 的 每 个 函数 依赖 都 作为 主 码 。 


例 : 雇员 可 以 有 很 多 专业 ， 每 个 专业 可 以 有 很 多 雇员 。 雇 员 可 以 有 很 多 
经 理 ， 但 每 个 经 理 只 是 一 个 专业 的 经 理 :Wgr 一 Specialty 


EmpSpecMgr(EID, Specialty, ManageriD) 


FD ManageriD 一 Specialty is 


not currently a key. 





图 3-5A Boyce-Codd 范 式 。 注 意 ， 存 在 从 ManagerID 到 Specialty 的 函数 依赖 。 
因为 这 个 ED 不 是 关系 中 的 候选 主 码 ， 它 是 隐 含 的 ， 因 此 这 个 关系 不 满 
是 Boyce-Codd 范 式 


第 四 范式 的 定义 需要 技巧 ， 但 幸运 的 是 它 在 实际 中 并 不 常见 。 但 是 ， 如 果 它 出 现 了 仍 会 引 
起 问题 ， 因 此 ， 你 应 当 理 解 它 的 定义 。 第 四 范式 与 多 值 依赖 的 定义 密切 相关 。 

(7) 定义 : 多 值 依赖 (MVD) 

当 一 个 关系 中 至 少 存在 三 个 属性 (A、B 和 C， 也 可 能 是 属性 集 )， 并 且 属 性 A 决定 其 他 两 
个 (B 和 C), 但 另外 两 个 属性 相互 独立 时 ， 就 存在 多 值 依赖 《MVD)。 即 ,A 一 B 且 A 一 C, 但 
B 和 C 在 函数 上 并 不 相互 依赖 。 

例如 ， 雇 员 可 以 有 很 多 专业 并 且 被 分 配 很 多 工具 ， 但 工具 和 专业 并 不 直接 相关 。 
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(8) 定义 : 第 四 范式 (4NF) 

一 个 关系 满足 第 四 范式 ， 当 且 仅 当 它 满足 Boyce-Codd 范 式 并 且 不 存在 多 值 依赖 。 即 ， 关 
系 的 所 有 属性 函数 依赖 于 A。 如 果 A 一 一 B， 那 么 对 于 所 有 属性 Ai， 有 A 一 Ai。 

在 雇员 专业 和 工具 的 多 值 依赖 例子 中 ， 关 系 EmpSpecTools (EID，Specialty，ToolID) 不 
满足 第 四 范式 ， 因 为 存在 两 个 函数 依赖 ，EID 一 Specialty 和 EID 一 ToolID。 解 决 这 个 问题 得 到 
两 个 更 简单 的 关系 : EmployeeSpecialty (EID，Specialty) 和 EmployeeTools (EID ，ToolID )。 




















在 构造 应 用 软件 的 过 程 中 ,为 了 准确 地 查 出 想 要 的 数据 ， 创建 查 
询 是 一 个 重要 的 步骤 。 查 询 可 以 回答 业务 问题 ， 并 用 于 表单 和 报表 。 

第 4 章 介绍 如 何 使 用 两 个 基本 的 查询 系统 : SQL 和 QBE。SQL 作 为 
标准 的 优势 在 于 许多 数据 库 管 理 系 统 支持 它 。 学 会 SQL 就 能 够 使 用 诗 
多 不 同 的 系统 。 

第 $ 章 介绍 SQL 查询 的 部 分 强大 功能 。 特 别 是 ,检查 子 查询 来 回 
答复 杂 的 业务 问题 。 此 外 ，SQL 是 一 个 完备 的 数据 库 语 言 ， 可 以 用 于 
定义 新 的 数据 库 和 表 。SQL 还 是 一 个 操作 数据 的 强大 工具 。 








数据 查询 


本 章 学 习 内 容 


。 如何 从 数据 库 得 到 商务 查询 的 答案 ? 

“为 了 使 用 数据 库 系 统 ， 为 什么 需要 学 习 一 种 特殊 的 查询 语言 ? 
“为 了 创建 一 个 查询 ， 需 要 回答 哪 四 个 问题 ? 

* 如 何 利用 查询 执行 计算 ? 

。 如 何 利 用 分 组 比较 结果 ? 

* 为 什么 在 查询 中 要 连接 表 ? 如 何 连 接 表 ? 


4.1 开发 漫谈 


Miranda:， 哇 ! 工作 太 暴 了 ! 我 真希 望 以 后 规范 化 工作 可 以 简单 些 。 

Ariel: 你 现在 至 少 有 了 好 用 的 数据 库 。 下 一 步 呢 ? 你 准备 好 开始 构造 应 用 程序 了 吗 ? 

Miranda: 还 没有 。 我 告诉 我 的 叔叔 我 有 一 些 样 例 数据 。 他 已 经 问 我 具体 问题 ， 例 如 : 
哪 种 产品 订货 最 频繁 ? 上 个 月 哪个 员工 卖 得 最 多 ?我 认为 在 构造 应 用 程序 之 
前 ， 应 该 知道 如 何 回答 这 些 问题 。 

Ariel: 难道 不 能 通过 观察 数据 得 到 答案 吗 ? 

Miranda:， 也 许 ， 但 那样 太 费 时 。 相 反 ， 我 要 使 用 一 个 查询 系统 帮 有 我 做 大 部 分 工作 。 只 
要 知道 如 何 把 具体 问题 表达 为 正确 的 查询 就 可 以 了 。 


4.2 简介 


为 什么 需要 查询 语言 ? 为 什么 不 使 用 自然 语言 ， 比 如 英语 ?自然 语言 处 理 器 已 经 改善 ， 有 
的 公司 试图 把 它 和 数据 库 结 合 。 类 似 地 ， 语 音 识 别 也 在 改进 。 其 结果 是 ， 计 算 机 有 可 能 用 自然 
语言 回答 特定 的 问题 。 然 而 ， 即 使 有 优秀 的 自然 语言 处 理 器 ， 最 好 还 是 使 用 专业 的 查询 语言 。 
主要 的 原因 是 交流 。 如 果 你 问 一 个 关于 数据 库 的 问题 ， 一 台 计 算 机 ， 或 者 另外 一 个 人 ， 都 可 以 
得 到 答案 。 问 题 是 ， 计 算 机 给 出 的 答案 是 你 要 的 吗 ? 换 句 话 说 ， 你 必须 知道 计算 机 (或 者 其 他 
人 ) 按照 你 希望 的 方式 理解 问题 。 使 用 自然 语言 的 问题 就 是 具有 歧义 性 。 如 果 在 理解 上 存在 任 
何 疑问， 就 要 冒 着 风险 ， 得 到 一 个 看 上 去 合理 ， 但 实际 上 并 不 对 应 你 的 问题 的 答案 。 

一 个 查询 系统 比 自然 语言 更 加 结构 化 ， 可 以 减少 歧义 。 查 询 系统 还 可 以 变 得 更 加 标准 化 ， 
开发 者 和 用 户 可 以 学 习 一 种 语言 并 且 在 不 同 的 系统 中 使 用 ,SQL 是 一 种 标准 的 数据 库 查询 语言 。 
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国际 标准 化 组 织 (International Organization of Standards，ISO) 建立 的 标准 ， 每 隔 几 年 更 新 一 
次 。 大 部 分 数据 库 管理 系统 至 少 支持 SQL-99 标 准 ， 但 是 一 小 部 分 使 用 SQL-92 版 本 。ISO 工 作 
组 正在 开发 新 标准 ， 但 是 还 需要 几 年 才能 完成 。 虽 然 大 部 分 厂商 支持 这 些 标准 ， 但 是 仍然 存 
在 不 同 的 SQL 语法 ， 所 以 针对 一 个 数据 库 系 统 编写 的 查询 语句 在 别 的 系统 可 能 就 会 出 现 问 题 。 

大 部 分 数据 库 系统 也 支持 QBE 方 法 〈 示 例 查询 ，QBE) ， 帮 助 初学 者 创建 SQL 查询 。 这 些 
面向 可 视 化 的 工具 通常 允许 用 户 从 列表 中 选择 项 ， 并 且 处 理 语法 细节 ， 使 得 创建 特定 的 查询 
更 为 容易 。 虽 然 QBE 设 计 很 容易 ， 并 且 尽 量 减少 了 输入 从 而 节省 时 间 ， 但 学 习 SQL 命令 仍然 是 
必须 的 。 很 多 时 候 ， 需 要 在 程序 代码 中 插入 SQL 语句 ， 或 者 复制 和 编辑 SQL 语句 。 

既然 和 查询 打交道 ， 就 需要 全 面 地 考虑 数据 库 设计 。 第 3 章 介绍 如 何 规范 地 把 数据 分 解 为 
表 ， 实 现 数据 的 高 效 存储 。 查 询 是 问题 的 另 一 个 方面 : 把 表 连 接 ， 从 而 获得 特定 问题 的 答案 
并 产生 报表 。 


4.3 查询 语言 的 三 个 任务 


创建 数据 库 并 构造 应 用 程序 需要 做 三 件 事情 : (1) 定义 数据 库 ，(2) 改变 数据 ，(3) 检 
索 数 据 。 有 的 系统 使 用 形式 化 术语 描述 上 述 工作 。 定 义 数 据 表 和 数据 库 的 其 他 特征 的 命令 组 
合 为 数据 定义 语言 (DDL)。 通 用 DDL 命 令 包 括 ALTER、CREATE 和 DROP。 用 来 修改 数据 的 
命令 分 类 为 数据 操纵 语言 (DML)。 常 用 的 DML 命 令 是 DELETE、INSERT 和 UPDATE。 有 的 
系统 把 数据 检索 也 作为 DML 组 ， 但 是 SELECT 命令 非常 复杂 ， 需 要 单独 讨论 。 本 章 的 附录 列 出 
了 多 种 SQL 命令 的 语法 。 本 章 关注 SELECT 命令 。DML 和 DDL 命 令 将 在 第 5 章 详 细 讨 论 。 

SELECT 命令 用 于 检索 数据 ， 是 最 复杂 的 SQL 命令 ， 带 有 几 个 不 同 的 选项 。SELECT 命 令 
的 主要 功能 是 选择 满足 某 些 条 件 的 特定 数据 列 。 | 

数据 库 管理 系统 是 由 查询 系统 驱动 的 。 实 际 上 ， 所 有 的 工作 都 可 以 通过 DDL、DML 或 者 
查询 命令 来 完成 。 现 代 系 统 通 过 提供 图 形 接 口 简化 了 部 分 数据 库 管 理工 作 (例如 创建 表 )。 接 
口 实际 上 构造 了 合适 的 CREATE TABLE 命 令 。 


4.4 检索 数据 的 四 个 问题 


从 关系 DBMS 中 检索 数据 需要 回答 四 个 基本 问题 ， 如 图 4-1 所 示 。 查 询 系统 的 区 别 是 如 何 
回答 这 些 问题 。 记 住 这 四 个 问题 ， 但 是 顺序 并 不 重 
要 。 初 学 者 每 次 创建 查询 的 时 候 需 要 写 下 这 四 个 问 。 你 想得到 什么 结果 ? 
题 。 对 于 简单 的 问题 ， 不 知 不 觉 地 就 可 以 回答 它们 。 |。 已 经 知道 什么 (或 者 有 哪些 限制 ) ? 
对 于 复杂 的 问题 ， 可 以 先 部 分 地 回答 问题 ， 并 且 在 | "涉及 哪些 表 ? 
问题 间 切 换 ， 直 到 完全 理解 了 查询 。 “ 如 何 连接 表 ? 

注意 在 一 些 简单 的 情况 下 ， 可 能 不 需要 国 答 所 | 创建 查询 的 四 个 问题 。 每 次 建立 查询 
有 的 四 个 问题 。 很 多 简单 问题 只 涉及 一 个 表 ， 所 以 都 要 问 这 四 个 问题 ° 
不 需要 考虑 表 的 连接 (问题 3)。 再 举 一 个 例子 :如 
果 想 得 到 整个 公司 的 销售 总 额 ， 而 非 某 一 个 特定 员工 的 总 销售 额 ， 所 以 可 能 没有 任何 限制 
(问题 2) 。 
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4.4.1 你 想得到 什么 结果 


回答 这 个 问题 需要 从 存储 在 数据 库 中 的 多 个 表 中 选择 数据 列 。 当然 , 需要 知道 所 有 的 列 名 。 
一 般 而 言 ， 最 难 的 部 分 是 搞 清 楚 所 有 表 ， 并 且 找 到 确实 需要 查询 的 列 。 如 果 数 据 库 有 几 百 个 
个 表 和 几 千 个 列 ， 间 题 将 更 为 复杂 。 如 果 有 类 图 列 出 了 所 有 的 表 、 列 以 及 表 之 间 的 关系 ， 建 
立 查 询 会 简单 一 些 。 

查询 系统 可 以 生成 聚集 运算 ， 例 如 求 和 、 求 平均 值 。 类 似 地 ， 计 算 机 可 以 对 数字 型 数据 做 
基本 的 算术 运算 〈 加 、 减 、 乘 、 除 ) 。 


4.4.2 已 经 知道 什么 


大 部 分 情况 下 查询 带 有 多 个 限制 条 件 。 例 如 ， 只 对 某 一 特定 日 期 或 者 某 一 部 门 的 销售 感 兴 
趣 。 查 询 条 件 需 要 转换 成 标准 的 布尔 表达 式 (用 AND 和 OR 连接 的 表达 式 )。 这 一 步 最 重要 的 
是 写 下 所 有 的 限制 条 件 ， 以 帮助 理解 查询 的 目的 。 


4.4.3 涉及 哪些 表 


对 于 较 少 的 表 ， 这 个 问题 很 容易 。 对 于 数 百 个 表 ， 需 要 确定 究竟 需要 哪些 表 。 好 的 数据 字 
典 带 有 同义词 和 注释 ， 会 简化 选择 查询 所 需 相关 表 的 过 程 。 表 的 命名 是 否 准确 地 反映 了 内 容 
和 目的 也 是 至 关 重 要 的 。 

提示 : 表 的 选择 可 以 从 包含 上 述 前 两 个 问题 (结果 和 条 件 ) 中 列 出 的 相关 列 的 表 开 始 。 然 
后 判断 是 否 有 其 他 表 需 要 作为 中 介 来 连接 这 些 表 。 


4.4.4 如 何 连接 表 


这 个 问题 和 数据 规范 化 问题 相关 ， 并 且 是 关系 数据 库 的 核心 。 具 有 相似 列 的 表 可 以 连接 。 
例如 ，Order 表 含有 Customer ID 列 。 相 应 的 数据 存储 在 Customer 表 中 ， 这 个 表 中 也 有 Customer 
ID 列 。 大 多 数 情况 下 ， 不 同 表 中 匹配 的 列 具 有 相同 的 名 字 (例如 ，Customer ID) ， 这 就 比较 简 
单 。 然 而 ， 列 名 并 不 一 定 相 同 ， 所 以 有 时 需要 格外 小 心 。 例 如 ，Order 表 可 能 有 一 列 叫 做 
SalesPerson， 它 和 Employee 表 中 的 Employee ID 匹配 。 


4.5 Sally 的 宠物 商店 


最 初 的 宠物 商店 数据 库 已 经 建 好 ， 一 些 基本 的 历史 数据 也 已 经 从 Sally 的 旧 文 件 中 导出 。 
当 把 这 些 展示 给 Sally 时 ， 她 激动 异常 。Sally 立 即 开始 提出 业务 上 的 问题 ， 并 且 希 望 知道 数据 
库 如 何 回答 。 

本 章 的 例子 以 宠物 商店 数据 库 为 基础 。 表 和 关系 如 图 4-2 所 示 。 阅 读 每 一 节 之 后 ， 独 立 写 
出 查询 。 完 成 本 章 末 尾 的 练习 题 。 答 案 摆 在 眼前 的 上 时候， 查询 总 是 看 起 来 很 简单 。 在 学 习 写 
查询 的 过 程 中 ， 必 须 静 下 心 来 ， 认 真 回答 四 个 基本 问题 。 

第 3 章 描述 了 数据 规范 化 后 得 到 企业 的 商务 模型 。 表 的 列表 给 出 公司 如 何 运作 的 图 示 。 注 
意 宠物 商店 对 待 商品 和 动物 有 所 不 同 。 例 如 ， 每 个 动物 都 会 分 开 列 在 一 个 销售 中 ， 但 是 顾客 
可 以 购买 多 个 商品 〈 例 如: 几 袋 猫 食 ) 。 这 样 做 的 原因 是 需要 关于 动物 的 额外 信息 ， 而 这 些 信 


息 在 普通 商品 中 是 没有 的 。 





图 4-2 宠物 商店 数据 库 表 。 注 意 动 物 和 商品 是 类 似 的 ， 但 是 分 别处 理 它 们 


当 开始 接触 已 经 存在 的 数据 库 时 ， 第 一 步 需要 熟悉 表 和 列 。 还 要 浏览 部 分 主 表 ， 熟 悉 存储 
在 每 一 个 表 中 数据 的 类 型 和 数据 存储 量 。 理 解 术语 并 发 现 潜在 的 假设 。 例 如 ， 在 宠物 商店 的 
例子 中 ， 动 物 可 能 登记 有 领养 人 ， 但 是 只 能 有 一 个 领养 人 。 如 果 没 有 登记 ， 则 该 动物 的 领养 
人 列 为 NULL (或 缺失 )。 对 于 一 个 特定 的 公司 这 第 一 步 较 容易 ， 因 为 已 经 熟悉 了 该 公司 的 运 
作 和 标识 各 种 对 象 的 术语 。 


4.6 版 本 差异 


SQL 标准 是 一 个 典型 的 软件 发 展 折 中 的 例证 。 新 版 本 的 标准 提供 有 用 的 功能 ， 但 是 生产 者 
面临 保证 已 经 大 量 安装 的 程序 和 用 户 的 兼容 性 。 从 而 数据 库 产 品 有 实质 性 的 区 别 。 这 些 区 别 
甚至 比 看 到 的 图 形 化 界面 还 要 显著 。 为 了 保持 最 新 ， 本 章 (和 下 一 章 ) 中 的 描述 将 使 用 最 新 
的 SQL 标准 。 当 前 大 部 分 系统 使 用 的 版 本 支持 多 种 SQL 标准 。 例 如 ，Oracle 9i 支 持 最 新 的 多 表 
JOIN 语法 。 


4.7 基本 查询 


查询 要 从 简单 做 起 。 本 章 开 始 提出 只 涉及 一 个 表 的 查询 来 说 明 创建 查询 的 基本 知识 。 然 后 
讨论 限制 、 计 算 和 聚集 细节 ， 接 下 来 是 分 组 与 部 分 和 ， 最 后 讨论 如 何 同时 从 几 个 数据 表 中 选 
出 数据 。 

图 4-3 列 出 了 宠物 商店 的 几 个 常见 业务 问题 ， 大 部 分 比较 易于 回答 。 事 实 上 ， 如 果 表 
Animal 的 行 比较 少 ， 可 以 人 工 搜索 表 得 到 答案 。 实 际 上 ， 开 始 的 时 候 ， 可 以 手动 查询 问题 来 
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理解 查询 系统 所 做 的 工作 。 


。 列 出 所 有 黄 颜色 的 动物 。 

。 列 出 黄 颜 色 ， 且 出 生 于 2004 年 6 月 1 日 以 后 的 狗 。 

*， 列 出 所 有 和 猫 相关 ， 且 标价 大 于 10 美 元 的 商品 。 

， 列 出 所 有 的 雄性 并 且 已 登记 ， 或 者 出 生 于 2004 年 6 月 1 日 以 前 并 且 是 白色 的 狗 。 
。 动 物 的 平均 售 价 是 多 少 ? 

。 所 有 动物 的 总 成 本 是 多 少 ? 

。 列 出 前 10 位 顾客 和 他 们 的 消费 总 额 。 


。 动 物 列 表 中 有 多 少 只 猫 ? 

"计算 每 一 类 动物 的 数量 。 

。 列 出 2004 年 4 月 1 日 至 2004 年 5 月 31 日 购物 的 每 位 顾客 的 CustomerID。 

。 列 出 2004 年 4 月 1 日 至 2004 年 5 月 31 日 购物 的 顾客 的 名 和 电话 。 

。 列 出 2004 年 6 月 1 日 至 2004 年 12 月 31 日 购买 登记 的 白 猫 的 顾客 的 姓 和 电话 。 
。 哪个 雇员 卖 出 的 项 目 最 多 ? 





图 4-3 宠物 商店 问题 示例 。 这 些 问题 只 涉及 一 个 表 ， 所 以 比较 简单 。 这 些 是 经 
理 或 顾客 经 常 问 的 典型 问题 
查询 的 本 意 是 从 表 中 找到 想 要 的 列 ， 并 且 按 照 一 定 的 标准 限制 输出 行 。 例 如 ， 在 第 一 个 查 
询 ( 黄 颜色 的 动物 ) 中 ， 和 希望 的 查询 结果 包括 AnimalID 、Category、Breed 和 Color。 限 制 返回 
结果 只 显示 黄 颜 色 的 ， 而 不 是 全 部 动物 。 


4.7.1 单 表 


第 一 个 要 考虑 的 查询 是 : 列 出 所 有 黄 颜色 的 动物 。 动 物 可 以 有 很 多 种 颜色 。 数 据 库 的 一 列 
是 用 来 存储 动物 颜色 的 。 一 个 动物 的 颜色 可 以 用 “ 黄 、 白 、 棕 ”来 描述 。 一 般 地 说 ， 主 要 的 
颜色 放 在 前 面 ， 但 是 没有 机 制 保证 数据 按照 这 种 方式 输入 。 

首先 考虑 使 用 QBE 系 统 解决 这 个 问题 ， 如 图 4-4 所 示 。QBE 系 统 询问 涉及 哪些 表 。 这 种 情 
况 只 涉及 一 个 表 : Animal。 所 有 的 颜色 输出 来 自 于 表 Animal。 类 似 地 ， 限 制 条 件 中 的 列 Color 
也 在 表 Animal 中 。 在 表 中 ， 可 以 选择 需要 输出 的 列 。 这 个 问题 有 一 点 含糊 ， 所 以 选择 
AnimalID 、Category、Breed 和 Color。 

下 一 步 是 输入 已 知 的 查询 条 件 。 在 这 个 例子 中 ， 要 查询 的 是 黄 颜色 的 动物 。 在 QBE 屏 幕 
上 列 Color 输 入 条 件 “ 黄 ”。 有 一 点 需要 注意 : 列 Coior 通 常 包括 多 个 词 。 对 于 有 的 动物 ， 黄 可 
能 作为 第 二 个 或 者 第 三 个 颜色 出 现在 列表 中 。 为 了 匹配 动物 ， 而 不 考虑 yellow 出 现 的 位 置 ， 需 
要 使 用 模式 匹配 冰 数 LIKE。 输 入 条 件 LIKE “%yellow% " ， 要 求 查询 系统 匹配 列表 中 任何 位 置 
出 现 的 yellow (在 yellow 前 后 可 以 出 现任 意 数 量 的 字符 )。 现 在 可 以 执行 查询 了 。 注 意 保 证 列 
Color 中 确实 存在 yellow。 


4.7.2 SQL 介绍 


SQL 是 一 种 强大 的 查询 语言 。 但 是 和 QBE 不 同 ， 通 常 需要 输入 整个 语句 。Microsof' 
Access 等 系统 允许 在 QBE 和 SQL 之 间 反 复 切 换 ， 这 样 可 以 减少 输入 。 也 许 SQL 最 大 的 优势 在 于 
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它 是 一 种 大 部 分 DBMS 版 本 都 支持 的 标准 。 因 此 ， 一 旦 学 会 了 这 个 基本 语言 ， 就 可 以 在 所 有 当 
前 主要 的 系统 上 创建 查询 。 一 些 人 把 SQL 读 成 “sequel”， 争 辩 说 它 由 一 种 叫做 quel 的 早期 
DBMS 发 展 而 来 。 而 且 ,“Sequel” 比 “ess-cue-el” 更 容易 读 。 


哪些 表 ? 






想得到 什么 ? 
什么 条 件 ? 


图 4-4 QBE 和 SQL 查 询 示 例 。 因 为 只 有 一 张 表 ， 只 需 回答 三 个 问题 ， 哪些 表 ? 
想得到 什么 ?什么 条 件 ? 
在 SQL 中 最 常用 的 命令 是 SELECT 语句 ， 其 作用 是 从 表 中 找 出 数据 。 图 4-5 是 一 个 简单 命令 
的 例子 ， 包 括 四 个 基本 部 分 : SELECT、FROM、JOIN 和 WHERE。 这 些 部 分 与 每 个 查询 都 需要 
的 基本 问题 相 匹 配 。 在 图 4-4 的 例子 中 ,注意 QBE 和 SQL 的 相似 性 。 


SELECT columns 你 想得到 什么 ? 
FROM tables 涉及 到 哪些 表 ? 


JOIN conditions 如 何 连接 表 ? 
WHERE criteria 有 哪些 限制 ? 





图 4-5 基本 的 SQL 语句 SELECT 命令 匹配 创建 查询 需要 回答 的 四 个 基本 问题 。 
大 写字 母 表示 SQL 关键 字 。 也 可 以 使 用 小 写字 母 


4.7.3 输出 排序 


数据 库 系 统 把 表 看 作 数据 集合 。 为 了 提高 效率 ，DBMS 以 任意 的 方式 ， 或 以 任意 顺序 存储 
表 数 据 。 然 而 大 部 分 情况 下 ， 和 希望 返回 结果 按照 一 定 的 顺序 显示 。SQL 的 ORDER BY 子 句 是 一 
种 简单 快速 的 方法 ， 它 可 以 按照 指定 的 顺序 显示 输出 结果 。 如 图 4-6 所 示 ， 直 接 列 出 排序 的 列 。 
默认 为 升序 (从 A 到 Z 或 对 于 数值 型 从 小 到 大 ) 。 如 果 希 望 从 大 到 小 排序 ， 则 在 列 后 加 上 DESC 
(降序 )。 在 QBE 中 ， 可 以 在 QBE 格 中 选择 排列 顺序 。 
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SELECT Name, Category, Breed 
AnimallD | FROM Animal 

Name ORDER BY Category, Breed 
Category 

Breed 

DateBorn 

Gender 





图 4-6 ORDER BY 子 名 对 输出 行 排序 。 默 认 按 照 升序 排列 ， 加 在 列 名 后 面 的 关 
键 字 DESC 表 示 按照 降序 排列 。 如 果 像 Category 列 那样 含有 相同 的 数据 ， 
则 依据 第 二 列 排序 
有 的 时 候 ， 排 序 所 依据 的 列 并 不 包含 惟一 的 数据 。 例 如 ， 图 4-6 的 行 按照 Category 排 序 。 
这 时 ， 可 能 需要 另 一 个 排序 列 。 在 这 个 例子 中 ， 具 有 相同 种 类 (例如 Bird) 的 行 按照 列 Breed 
排序 。 首 先 按照 写 在 前 面 的 列 排 序 。 在 例子 中 ， 所 有 的 鸟 被 排 在 前 面 ， 然 后 鸟 按照 Breed 排 序 。 
在 QBE 中 为 了 改变 排序 列 ， 必 须 移动 QBE 格 中 的 整个 列 ， 使 得 Category 位 于 Breed 的 左 侧 。 
4.7.4 关键 字 Distinct 
[EE 
在 有 些 查询 中 ，SELECT 语 名 可 以 使 用 一 个 有 用 | “中 ow At SEN DISTINCT Category 
的 选项 。 关 键 字 DISTINCT 告 诉 DBMS 只 显示 独特 的 


行 。 例 如 ， 图 4-7 的 查询 (SELECT Category FT Bogory 
Animal) 会 返回 一 长 串 动物 类 型 (Bird、Cat、 Dog 等 )。 Da 

实际 上 ， 列 出 了 表 中 所 有 动物 的 种 类 。 很 明显 ， 有 很 Flsh 
多 猫 和 狗 。 为 了 避免 显示 重复 数据 ， 使 用 SELECT Reptile 


Spider 


DISTINCT 短 语 。 

注意 DISTINCT 关 键 字 应 用 于 整 行 。 如 果 一 行 中 
含有 任何 不 同 ， 就 会 显示 。 例 如 ， 查 询 SELECT 
DISTINCT Category, Breed FROM Animal 会 返回 不 止 
图 4-7 所 示 的 7 行 ， 因 为 每 一 类 动物 有 很 多 种 。 也 就 是 
说 , 每 一 个 类 /种 组 合 只 显示 一 次 , 例如 Dog/Retriever。 | 


Mi ft A DISTINCT 字 ,， 但 是 必 乡 
Jerosont Aceess 支 和 关键 字 ， 但 是 必须 在 图 4-7 关键 字 DISTINCT 消 除 输 出 中 重复 


SQL 语句 中 使 用 。 的 行 。 如 果 没 有 它 ， 则 显示 数据 库 
475 条 伯 中 所 有 动物 的 种 类 











大 部 分 情况 下 ， 识 别 输 出 列 和 表 是 简单 的 。 如 果 有 几 百 个 表 ， 可 能 会 花 一 些 时 间 来 决定 需 
要 哪些 表 和 哪些 列 ， 但 这 是 一 个 长 期 的 问题 。 另 一 方面 ， 找 出 限制 条 件 并 且 准 确 地 表达 出 来 
更 具 挑 战 性 。 更 重要 的 是 ， 如 果 限 制 条 件 出 现 错误 ， 仍 然 可 以 得 到 “答案 。 问 题 是 这 个 答案 
不 是 希望 得 到 的 ， 而 且 通 常 很 难 发 现 错误 。 
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限制 的 主要 概念 是 基于 数学 课 上 学 习 的 布尔 代数 。 实 际 上 ， 就 是 不 同 的 条 件 用 AND 和 OR 
连接 起 来 。 有 时 也 需要 NOT 语 名 ， 表 示 否 定 或 者 对 后 面 语 句 的 真 值 取 反 。 例 如 ，NOT 
(Category =“Dog”) 表 示 除 了 狗 以 外 的 所 有 动物 。 

考虑 图 4-8 的 例子 。 第 一 步 要 注意 三 个 条 件 定义 查询 问题 ， 狗 、 黄 色 和 出 生日 期 。 第 三 步 
是 认识 到 这 三 个 条 件 必须 同时 为 真 ， 所 以 使 用 AND 连 接 。 数 据 库 系统 会 逐 行 检查 ， 计 算 所 有 
三 个 子 句 。 如 果 任 何 一 个 子 句 为 假 ， 该 行 被 跳 过 。 





Ma sR a A ed ed 5 
列 出 所 有 黄 颜 色 的 狗 ， 并 且 出 生日 期 在 2004 年 6 月 1 日 之 后 


图 4-8 布尔 代数 。 一 个 由 AND 连 接 起 来 的 三 个 条 件 的 例子 。 注 意 # 把 日 期 括 起 
来 。 这 是 在 Microsoft Access 中 识别 日 期 的 规则 。 如 果 输 入 一 个 文本 日 期 
(例如 June 1，2004) 就 更 有 用 了 


注意 SQL 语句 是 直截了当 的 ， 只 要 写 下 条 件 即 可 。QBE 有 一 些 麻 烦 : 写 在 同一 行 的 每 个 条 
件 用 AND 子 名 连接 ， 而 不 同行 的 条 件 用 OR 子 名 连接。 创建 (或 者 阅读 ) QBE 语 句 必 须 小 心 ， 
尤其 是 有 很 多 条 件 行 的 时 候 。 


4.7.6 布尔 代数 


查询 的 一 个 最 重要 方面 就 是 选择 想 要 的 行 。 大 部 分 表 包 含 大 量 的 行 ， 而 只 需要 查看 满足 某 
一 查询 条 件 的 几 行 。 一 些 条 件 是 直接 的 。 例 如 ， 只 查询 狗 。 有 时 条 件 比 较 复杂 ， 涉 及 几 个 条 
件 。 例 如 ， 一 个 顾客 想 要 所 有 黄 颜色 的 狗 ， 出 生 在 2004 年 6 月 1 日 之 后 ， 或 者 注册 为 黑色 实验 
室 。 条 件 通 过 布尔 代数 计算 ， 布 尔 代数 是 用 于 计算 条 件 的 标准 规则 集 。 你 可 能 已 经 从 基本 代 
数 课 程 中 学 过 了 ,但 是 小 心 一 点 总 是 没 错 的 。 | a[blaANDb|aoRb | 

DBMS 使 用 布尔 代数 计算 包含 多 个 子 句 的 条 件 。 子 句 
由 运算 符 : AND、OR、NOT 连 接 而 成 。 每 一 个 独立 子 句 
计算 布尔 值得 到 真 或 者 假 ， 然 后 使 用 这 些 运算 符 计 算 整 
个 条 件 的 真 值 。 图 4-9 展 示 了 主要 的 运算 符 (AND、OR) 
是 如 何 工 作 的 。DBMS 检 查 每 一 个 数据 行 ， 并 且 计算 布尔 





条 件 值 。 只 有 条 件 为 真 的 时 候 才 显示 相应 的 行 se 
不 外” © 由 AND 连 接 起 来 的 两 个 子 句 必 
由 AND 连 接 两 个 子 句 构成 的 条 件 语句 ， 如 果 它 们 (a re ie 


和 b) 都 取 真 ， 则 结果 为 真 。 由 OR 连接 两 个 子 句 构成 的 条 子 句 只 要 有 一 个 为 真 即 可 


件 语 句 ， 只 要 至 少 有 一 个 条 件 为 真 ， 则 结果 为 真 。 考 虑 图 4-10 的 例子 。 第 一 个 条 件 要 求 两 个 子 
名 都 为 真 ， 但 第 一 个 为 假 ， 所 以 结果 为 假 。 第 二 个 例子 只 要 求 两 个 子 句 中 的 一 个 为 真 ， 所 以 
结果 为 真 。 考 虑 宠物 商店 的 例子 。 如 果 一 个 顾客 查看 黄色 狗 的 列表 ， 他 (或 者 她 ) 想得到 的 
是 种 类 为 Dog 并 县 AND 颜 色 是 黄色 的 动物 列表 。 

如 图 4-11， 添 加 另外 的 子 旬 使 条 件 语 句 变 得 更 加 复杂 。 复 杂 性 源 于 条 件 由 多 个 AND 连 接 
符 和 多 个 OR 连接 符 组 成 。 在 这 种 情况 下 ， 结 果 的 真 值 取决 于 子 句 的 计算 顺序 。 插 号 可 以 决定 
运算 顺序 。 首 先 计算 最 内 层 的 括号 。 图 4-11 中 上 面 的 例子 AND 运 算 符 在 OR 运算 符 之 前 计算 ， 
结果 为 真 。 图 中 下 面 的 例子 OR 连接 符 先 计 算 ， 结 果 为 假 。 






(a > 4) AND (b < 0) 
ES 







(a>4)0R(b<0) 
i 





NOT (b < 0) 





(a>4)AND((b<0)OR(c>1)) 
。 a 
We 











图 4-10 布尔 代数 示例 。 分 别 计算 每 一 个 子 句 。 图 4-11 由 AND 和 OR 混合 构成 的 布尔 代数 。 运 算 结 
然后 计算 连接 值 。NOT 运 算 符 对 真 值 果 取 决 于 哪个 运算 符 先 计算 。 必 须 使 用 括号 
取 反 确定 运算 顺序 。 首 先 计算 最 内 层 的 子 句 


如 果 不 用 括号 ， 运 算 按 照 运 算 符 从 左 到 右 顺序 执行 。 这 个 结果 可 能 和 希望 的 不 符 。 但 是 ， 
DBMS 仍 然 会 给 出 运算 结果 。 为 了 安全 起 见 ， 复 杂 的 条 件 应 该 一 次 在 一 个 子 句 中 输入 完毕 。 每 
次 检查 输出 结果 确保 符合 要 求 。 为 了 找到 图 4-11 的 匹配 条 件 ， 首 先 输入 (a>4) 子 句 ， 显 示 所 
有 结果 。 然 后 增加 (b<0) 子 句 ， 显 示 结 果 。 最 后 ， 增 加 括号 和 (c>1) 子 句 。 

不 管 如 何 小 心地 设计 布尔 代数 ， 错 误 总 是 无 法 避免 的 。 原 因 在 于 像 英语 这 样 的 自然 语言 
身 是 有 歧 异 性 的 。 例 如 ， 考 虑 顾客 提出 的 问题 列 出 “所 有 黄色 的 或 者 白色 的 ， 并 且 6 月 1 日 之 
后 出 生 的 狗 ”。 这 旬 话 有 两 种 解释 : 

1)( 狗 AND 黄 色 ) OR (白色 AND6 月 1 日 之 后 出 生 )。 

2)( 狗 ) AND-( 黄 色 OR 白 色 ) AND (6 月 1 日 之 后 出 生 )。 

这 两 个 请 求 显然 是 不 同 的 。 第 一 种 解释 返回 所 有 黄色 的 狗 ， 即 使 年 龄 大 一 些 。 第 二 种 解释 
只 返回 年 轻 的 狗 ， 并 且 它 们 必须 是 黄色 或 者 白色 。 大 部 分 人 说 话 时 不 使 用 括号 ， 尽 管 停 顿 有 
助 于 理解 说 话 的 含义 。 一 个 好 的 设计 者 (或 者 售货员 ) 会 要 求 顾客 澄清 一 下 。 


4.7.7 德 摩根 定律 


设计 查询 是 一 个 逻辑 练习 。 逻 辑 学 家 德 摩根 (Augustus DeMorgan) 发 明了 一 种 化 简 复杂 
查询 的 技术 。 考 虑 图 4-12 所 示 的 宠物 商店 例子 。 一 个 顾客 光临 ， 并 且说 :“ 我 要 一 只 猫 ， 但 是 
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不 想 要 已 经 登记 的 或 者 红色 的 "。 即 使 使 用 SQL， 查 询 条 件 也 有 些 复杂 : (Category = “cat ) 
AND NOT ((Registered is NOT NULL) OR (Color LIKE “%red%”))。 取 反 运 算 符 (NOT) 增 
加 了 理解 问题 的 难度 。 如 果 用 QBE 创 建 查 询 就 更 为 复杂 了 。 


顾客 :“ 我 想 要 一 只 猫 ， 但 是 不 想 要 已 经 登记 的 或 者 红色 的 。 







SELECT Animallp, Category, Registered, Color 
|| FROM Animal 


[Category [DateBorm |Color | 
Amal | 


ri 


图 4-12 带 有 取 反 的 例子 。 顾 客 知道 他 (或 者 她 ) 不 想 要 什么 。SQL 可 以 使 用 
NOT， 但 是 应 该 使 用 德 摩根 定律 对 Registered 和 Color 语 句 取 反 
问题 的 解决 有 赖 于 德 摩根 定律 (DeMorgan's Law)， 这 个 定律 阐述 了 当 两 个 子 句 用 AND 或 
者 OR 连接 的 时 候 ， 如 何 对 条 件 取 反 。 德 摩根 定律 指出 : 对 带 有 AND 或 者 OR 连接 符 的 条 件 取 
反 ， 等 价 于 对 每 一 个 子 句 取 反 ， 并 且 改 变 连接 符 。AND 变 成 OR， 反 之 亦 然 。 图 4-13 展 示 了 完 
物 商店 顾客 例子 中 如 何 使 用 取 反 条 件 。 每 一 个 条 件 都 取 反 (NOT NULL 变 成 NULL，red 变 成 
NOT red) 。 连 接 符 从 OR 变 成 AND。 图 4-13 展 示 了 使 用 两 种 方法 计算 的 最 终 真 值 相同 。 





Registered = ASCF 
Color = Black 
NOT ((Registered is NOT NULL) OR (Color LIKE "*red*")) 
a 2 F 
Pe 
(Registered is NULL) AND NOT (Color LIKE "*red*")) 


F no 一 F 
SS 
图 4-13 德 摩根 定律 。 复 合 语句 的 否定 通过 对 每 一 项 取 反 ， 同 时 交换 连接 符 
(AND 变 成 OR) 实现 。 使 用 真 值 表 计算 示例 
条 件 的 新 表达 形式 的 优点 在 于 更 容易 理解 ， 在 QBE 中 更 容易 表达 。 在 QBE 中 分 别 输入 
Registration 和 Color 两 个 子 句 。 把 它们 放 在 同一 行 ， 用 AND 连 接 。 在 自然 语言 中 ， 新 的 形式 表 
达 如 下 ; 一 只 没有 登记 且 不 是 红色 的 猫 。 
实际 上 ， 德 摩根 定律 用 于 简化 复杂 语句 。 但 是 ， 用 测试 数据 计算 真 值 表 仍然 是 必要 的 。 
如 果 在 一 个 查询 中 混合 使 用 AND 和 OR 子 句 ， 条 件 将 变 得 更 为 复杂 。 考 虑 图 4-14 中 的 问题 ， 





列 出 所 有 的 狗 ， 雁 性 的 并 且 登 记过 ， 或 者 出 生 于 2004 年 6 月 1 日 之 前 并 且 是 白 颜 色 的 。 





SELECT AnimaliD, Category, Gender, Registered, DateBorn, Color 
FROM Animal 
WHERE ((Category = "Dog”) AND 
(( (Gender = "Male”) AND (Registered is Not Nuil) ) OR 
( (DateBorn < #6/1/2004#) AND (Color Like White) ) ) ); 


[RE | AnimaliD TCR | Gonder [Rom [Color 
[Anmal | Animal [Animal [Animal [Animal |Anma 
一 一 一 一 
| 

列 出 所 有 的 狗 ， 雄 性 的 并 且 登 记过 ， 或 者 出 生 于 2004 年 6 月 1 日 之 前 并 且 是 白 颜色 的 





图 4-14 布尔 条 件 一 一 混合 使 用 AND 和 OR。 注 意 在 SQL 中 使 用 括号 保证 计算 顺 
序 符合 预想 。 并 且 ，QBE 要 求 两 行 中 都 出 现 重复 条 件 “Dog” 
首先 ， 注 意 英语 中 将 两 个 子 句 组 合 存在 歧义 。 图 4-15 给 出 两 种 可 能 。 第 二 种 解释 和 第 一 种 
有 所 不 同 ， 消 除 歧义 的 方法 或 者 是 使 用 括号 ， 或 者 使 用 更 多 的 文字 。 
列 出 所 有 的 狗 ， 礁 性 的 并 且 登 记过 ， 或 者 出 生 于 2004 年 6 月 1 日 之 前 并 且 是 


白 颜色 的 
1: (雄性 的 并 且 登 记过 ) 或 者 (出 生 于 2004 年 6 月 1 日 之 前 并 且 是 白 颜 色 的 ) 


2: (雄性 的 ) 并 且 (登记 过 或 者 出 生 于 2004 年 6 月 1 日 之 前 ) 并 且 (是 白 颜 
色 的 ) 





图 4-15 自然 语言 的 歧义 使 得 这 句 话 可 以 用 任何 一 种 方式 理解 。 但 是 ， 通 常理 
解 为 第 一 种 含义 

用 SQL 表达 查询 是 直截了当 的 ， 只 要 使 用 括号 表明 每 一 个 子 句 的 计算 优先 级 。 最 内 层 的 子 
名 首先 计算 。 一 个 校正 查询 的 技巧 是 在 某 - 行 上 用 T 和 F 标 识 每 一 个 条 件 。 下 一 步 ， 用 括号 和 
连接 符 (AND、OR) 把 这 些 标志 连 起 来 。 然 后 阅读 原来 的 语句 ， 检 查 结果 是 否 相同 。 

如 果 使 用 QBE, 列 出 同一 行 用 AND 连 接 的 子 句 , 每 个 子 句 可 以 放 在 一 对 括号 里 而 含义 不 变 。 
OR 的 每 个 子 名 分 开放 在 不 同行 。 为 了 解释 查询 ， 需 要 分 别 观察 每 一 个 条 件 行 。 如 果 一 行 中 的 
所 有 条 件 为 真 ， 这 一 行 匹配 成 功 。 数 据 行 只 要 满足 一 个 独立 的 条 件 行 (不 需要 满足 所 有 行 )。 

构造 复杂 查询 的 另 一 个 提示 : 一 次 只 测试 条 件 的 一 部 分 ， 对 于 QBE 更 是 如 此 。 在 这 个 例 
子 中 ， 先 写 下 并 测试 条 件 : 雄性 并 且 登 记过 。 然 后 增加 另外 的 条 件 并 且 在 每 一 步 检查 结果 。 
虽然 这 样 做 比 一 步 跳 到 最 后 查询 要 慢 一 些 ， 但 是 ， 这 样 做 有 助 于 保证 得 到 正确 答案 。 检 查 查 
询 里 SQLWHERE 子 句 中 括号 的 正确 性 总 是 明智 的 。 
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4.7.8 有 用 的 WHERE 子 名 


大 部 分 数据 库 系统 提供 比较 运算 符 ,， 如 图 4-16 所 示 。 标准 的 数据 可 以 用 等 号 和 不 等 号 比较 。 
文本 比较 通常 使 用 LIKE 运 算 符 做 模式 匹配 。Oracle 和 SQL Server 支 持 的 SQL 标 准 用 百 分 号 (%) 
匹配 多 个 字符 ， 用 下 划 线 (_) 匹 配 单 个 字符 。 而 Microsoft Access 使 用 星 号 (*) 和 问号 (? )。 
单字 匹配 对 于 搜索 文本 字符 串 ， 例如 产品 号 ， 特 别 有 用 。 例 如 ， 品 号 可 能 具有 
DDDCCC9999 的 形式 ， 前 三 个 字母 代表 部 门 ， 中 间 三 个 代表 产品 类 ， 最 后 四 位 是 无 重复 序号 。 
为 了 找到 所 有 关于 Dog 类 的 产品 , 可 以 使 用 WHERE 条 件 如 下 : ProductID LIKE “__dog ”。 
大 部 分 系统 支持 文本 提供 比较 是 否 对 大 小 写 敏感 的 控制 选项 。 许 多 人 倾向 于 忽略 此 项 ， 因 为 
忽略 大 小 写 输入 更 方便 。 


<, =, >, <>, BETWEEN, LIKE, IN 
AccountBalance > 200 


Name > ‘Jones’ 
License LIKE ‘A__82_° 


Name LIKE ‘J96’ 

SaleDate BETWEEN '15-Aug-2004' AND ‘31-Aug-2004 
City IS NULL 

Name Is NOT NULL 





Category IN (‘Cat’, ‘Dog’, ‘Hamster’) 


图 4-16 WHERE 子 句 中 常用 的 比较 。BETWEEN 子 句 可 以 用 于 任何 数据 ， 对 于 
日 期 尤为 有 用 


BETWEEN 子 句 不 是 必需 的 ， 但 可 以 节省 很 多 输入 ， 使 一 些 条 件 更 清晰 。 子 名 (SaleDate 
BETWEEN ‘15-Aug-2004”AND ‘31-Aug-2004’ ) 等 价 于 (SaleDate >=“15-Aug-2004， 
AND SaleDate <=“31-Aug-2004' ) 。 这 种 日 期 标识 法 可 以 在 大 部 分 数据 库 系统 上 使 用 。 一 些 
系统 也 允许 使 用 更 短 的 形式 ， 但 是 必须 指定 转换 形式 。 这 些 转换 函数 不 是 标准 的 。 例 如 ， 
Access 可 以 接受 大 部 分 日 期 格式 ， 只 要 用 井 号 (#) 代替 括号 。Oracle 通 常 要 求 使 用 TO_DATE 
转换 函数 ， 例 如 SaleDate>=TO_DATE(“8/15/04”, “mm/dd/yy”)。 尤 其 是 开始 使 用 一 个 新 的 
DBMS 时 ， 一 定 注意 小 心 检查 所 有 日 期 转换 。 

另 一 个 有 用 的 条 件 是 空 值 (NULL) 测试 。 两 个 常用 的 形式 是 IS NULL 和 IS NOT NULL。 
注意 语句 (City = NULL) 在 大 部 分 系统 中 是 不 对 的 ， 因 为 NULL 不 是 一 个 真实 的 值 。 必 须 使 
用 (City IS NULL)。 


4.8 计算 


大 部 分 情况 使 用 电子 表格 或 者 独立 的 程序 进行 复杂 计算 。 但 是 查询 语句 也 可 以 完成 两 类 计 
算 : 聚集 运算 和 简单 的 逐 行 运 算 。 有 时 候 ， 这 两 类 计算 结合 在 一 起 。 首 先 考虑 逐 行 计算 。 


4.8.1 基本 运算 
SQL 和 QBE 都 可 以 用 于 对 每 一 行 数据 进行 基本 计算 。 这 个 技术 可 以 用 作 自 动 基本 任务 ， 减 
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少数 据 存储 。 考 虑 一 个 普通 的 订购 表 或 销售 表 。 如 图 
4-1 7 所 示 》 基 本 表 包 括 一 系 列 购物 的 基 本 信 息 : Orderltem(OrderlD, ltemlD, Price, Quantity) 
OrderItem(OrderID, ItemID, Price, Quantity)。 大 部 分 
情况 下 ， 需 要 把 Price 和 Quantity 相 乘 得 到 每 一 笔 订 单 ”| select 0rderlD, ltemlD, Price, Quantity, 
的 总 额 。 因为 这 个 计算 是 通用 的 (没有 任何 特殊 条 件 )， | Price Cuanity As Exlended 
没有 必要 存储 计算 结果 一 一 在 需要 的 时 候 ， 都 可 以 计 
算得 到 。 只 要 构造 一 个 查询 ， 并 且 加 入 一 列 。 新 列 使 
用 初等 代数 ， 并 且 给 出 名 字 : Price * Quantity AS 
Extended。 切 记 每 一 行 的 计算 在 查询 时 执行 。 

一 些 系统 提供 附加 的 数学 函数 。 例 如 : 绝对 值 、 
对 数 、 三 角 函 数 等 基本 数学 函数 。 虽 然 这 些 函数 提供 
了 额外 的 功能 ， 但 是 要 记 住 ， 它 们 只 能 对 表 或 查询 中 “图 4 1” 计 算 。 查 询 中 可 以 进行 数字 数据 


5 基本 运算 (+、--、*、/)。 新 显 
的 某 一行 存储 的 数据 进行 操作 。 示 的 列 应 该 有 一 个 有 意义 的 名 字 
4.8.2 聚集 运算 








在 商务 处 理 中 ， 数 据 库 经 常 需要 计算 总 数 和 部 分 和 。 因 此 ， 查 询 系 统 提供 了 对 数据 的 聚集 


运算 函数 。 图 4-18 列 出 了 常见 的 函数 ， 它 们 都 对 若干 
行进 行 运 算 ， 返回 一 个 值 。 最 常用 的 函数 是 Sum 和 FROM SaleAnimal; 
Avg， 这 一 点 和 电子 表格 的 情况 相似 。 Sa 

在 SQL 中 ， 函 数 简 单 地 加 入 SELECT 语 句 即 可 。 
在 QBE 中 ， 函 数 一 般 作为 单独 的 行 Total 列 出 。 在 
Microsoft Access 中 , 先 点 击 工具 栏 上 的 求 和 按钮 ( >)， 
把 Total 行 加 入 QBE 格 中 。 在 SQL 和 QBE 中 ， 应 为 新 列 
起 一 个 有 意义 的 名 字 。 

Count 函 数 在 很 多 情况 下 是 有 用 的 ， 但 是 一 定 要 理 
解 Sum 和 Count 的 区 别 。Sum 计 算 一 列 数 的 总 和 。 
Count 计 算 行 数 。 可 以 为 Count 函 数 传递 一 个 参数 ， 但 


是 很 / SN 用 Count(*) 就 可 以 了 。Count 函 ”图 4-18 聚集 函数 。QBE 和 SQL 的 查询 例 
al he ee hen 子 : 所 有 动物 的 平均 售 价 是 多 


Sum 
Avg 
Min 
Max 


Count 
StDev or StdDev 
Var 





数 的 困难 之 处 在 于 理解 何 时 使 用 它 。 必 须 首先 理解 语 pe ed 
言 的 问题 。 例 如 ，S$ally 有 多 少 个 雇员 ? 这 个 问题 用 时 必须 点 击 工具 栏 上 的 求 和 按钮 
Count 函 数 : SELECT Count(*) From Employee。 商 品 (二) 显示 QBE 格 的 Total 行 


9764 一 共 卖 出 了 多 少 套 ? 这 个 问题 用 Sum 国 数 : SELECT Sum(Quantity) FROM OrderItem。 区 
别 在 于 在 Employee 表 中 每 行 只 有 一 个 雇员 ， 但 是 顾客 可 以 一 次 购买 多 个 同一 物品 。 还 要 记 住 
Sum 只 能 用 在 数字 型 的 数据 列 〈 例 如 : Quantity ) 。 

在 很 多 情况 下 ， 把 逐 行 计 算 和 聚集 函数 结合 在 一 起 。 图 4-19 中 的 例子 要 计算 某 一 订单 的 总 
价格 。 为 了 计算 总 价格 ， 数 据 库 必须 先 计算 每 一 行 的 Quantity*Cost， 然 后 对 这 一 列 求 和 。 这 
个 例子 还 说 明 ， 经 常 使 用 特定 的 条 件 (WHERE) 限制 用 于 计算 总 数 的 行 。 在 这 个 例子 中 ， 只 
需要 一 个 订单 的 总 数 。 





事 4 间 数据 查 均 739 


SELECT Sum([Quantity] *{Cost]) AS OrderTotal 
FROM 0rderltem 
WHERE (PONumber = 22); 





OrderTotal 
1798.28 





图 4-19 计算 。 在 聚集 函数 (Sum) 中 ， 进 行 逐 行 计算 (Quantity*Cost) ， 但 是 
只 有 最 后 的 总 数 显示 在 结果 中 

聚集 运算 有 一 个 重要 的 限制 需要 记 住 。 不 能 同时 既 显 示 细 节 行 ( 逐 行 ) 又 显示 总 数 。 在 订 
单 例子 中 ， 或 者 显示 细节 的 计算 (如 图 4-17) ， 或 者 显示 总 价格 (如 图 4-19)。 大 多 数 情况 下 ， 
运行 两 个 查询 是 简单 的 。 然 而 ， 如 果 想 同时 看 到 细节 和 总 数 ， 必 须 像 第 6 章 所 描述 的 那样 创建 
一 个 报表 。 

可 以 同时 计算 多 个 聚集 函数 。 例 如 ， 可 以 同时 显示 Sum、Average 和 Count:， SELECT Sum 
(Quantity), Avg (Quantity), Count (Quantity) From OrderItem。 事 实 上 ， 如 果 需 要 这 三 个 值 ， 可 
以 一 次 计算 。 考 虑 一 下 ， 如 果 表 有 一 百 万 行 数据 会 发 生 什么 。 如 果 分 成 三 个 独立 的 查询 ， 
DBMS 就 会 访问 数据 三 次 。 通 过 把 计算 合并 在 一 个 查询 中 ， 可 以 把 查询 时 间 减 少 到 三 分 之 一 。 
对 于 大 型 表 或 复杂 系统 ， 这 些 查 询 中 的 小 改动 就 可 以 使 有 的 系统 成 功 ， 而 有 的 系统 花费 数 天 
时 间 去 运行 。 

有 时 使 用 Count 函 数 ， 可 能 需要 包括 DISTINCT 运 算 符 。 例 如 ，SELECT COUNT 
(DISTINCT Category) FROM Animal， 计 算 不 同 种 类 的 数目 ， 不 考虑 重复 的 。 虽 然 这 个 命令 是 
SQL 标 准 的 一 部 分 ， 一 些 系统 (特别 是 Access) 不 支持 Count 语 句 中 的 DISTINCT 子 句 。 为 了 用 
Access 获 得 同样 的 效果 ， 首 先 用 DISTINCT 关 键 字 构造 如 图 4-7 所 示 的 查询 。 保 存 查询 结果 ， 在 
此 结果 上 构造 新 的 查询 计算 所 存 查询 数量 。 


4.8.3 函数 


SELECT 命令 也 支持 数据 的 运算 函数 。 这 些 运算 包括 数字 形式 的 比如 三 角 函 数 ， 字 符 串 
函数 比如 连接 两 个 字符 串 ， 日 期 函数 和 格式 函数 来 控制 数据 显示 。 不 幸 的 是 ， 这 些 函 数 没有 
标准 化 ， 所 以 每 个 DBMS 版 本 有 不 同 的 函数 名 字 和 不 同 的 功能 。 尽 管 这 样 ， 不 管 现在 使 用 的 
是 什么 DBMS， 都 应 该 学 会 如 何 做 某 些 典型 工作 。 图 4-20 列 出 了 一 些 可 能 需要 的 常见 函数 。 
即使 只 学 习 一 种 DBMS， 也 应 该 把 这 张 表 放 在 手边 ， 以 备 需要 把 查询 从 一 个 系统 移植 到 另 一 
个 系统 。 

字符 串 运 算 相 当 有 用 。 连 接 运 算 功 能 更 为 强大 ， 它 可 以 把 多 列 数据 合并 为 一 个 显示 域 。 对 
于 把 姓 和 名 连接 起 来 这 种 情况 尤其 有 用 。 其 他 常见 的 字符 串 函 数 把 字符 转换 为 小 写 或 大 写字 
母 。 长 度 函 数 计算 字符 串 列 包含 的 字符 数 。 子 串 函 数 返 回 字 符 串 的 所 选 部 分 。 例 如 ， 选 项 旺 
示 长 标题 的 前 20 个 字符 。 



















































Task Access 

Strings 

Concatenation FName & ““ & LName | FName +’ ‘+ LName FName || “|| LName 
Length Len(LName) Length(LName) LENGTH(LName) 
Uppercase UCase(LName) Upper(LName) UPPER(LName) 
Lowercase LCase(LName) Lower(LName) LOWER(LName) 





Partial string MiD(LName,2,3) Substring(LName,2,3) 





SUBSTR(LName,2,3) 























Dates 

Today Date( ) Time( ) Now( ) | GetDate0 SYSDATE 

Month Month(myDate) DateName(month, myDate) | TRUNC(myDate, ‘mm’) 
Day Day(myDate) DatePart(day, myDate) TRUNC (myDate, ‘dd’) 
Year Year(myDate) DatePart(year, myDate) TRUNC (myDate, ‘yyyy’) 






DateAdd 
DateDiff 


Date arithmetic DateAdd 


DateDiff 


Str(item, length, decimal) 
Format(item, format) Cast, Convert 


Cos, Sin, Tan, Sqrt 


ADD_MONTHS 
MONTHS_BETWEEN 
LAST_DAY 
TO_CHAR(item, format) 
TO_DATE(item, format) 














Formatting 
Numbers 
Math functions 

















Cos, Sin, Tan, Sqrt COS, SIN, TAN, SQRT 














Exponentiation 2^3 Power(2,3) POWER(2,3) 
Aggregation Min, Max, Sum, Count, Min, Max, Sum, Count, MIN, MAX, SUM, COUNT, 
Statistics Avg StDev, Var Avg, StDev, Var, AVG, STDDEV, VARIANCE, 


LinReqSlope, Correlation REGR, CORR 


| 





图 4-20 ”SQL 函数 的 区 别 。 这 张 表 显示 了 几 种 数据 库 的 常见 区 别 。 基 本 运算 在 
查询 中 很 常见 ， 但 是 进行 这 些 运 算 的 语法 依赖 于 特定 的 DBMS 

日 期 函数 在 商务 应 用 程序 中 很 常见 。 日 期 列 可 以 相 减 ， 得 到 两 个 日 期 之 间 的 天 数 。 还 有 其 
他 功能 ， 获 得 当前 日 期 和 时 间 ， 或 者 选 出 日 期 列 中 的 月 、 日 、 年 部 分 。 日 期 函数 可 以 对 日 期 
进行 月 、 周 、 年 相 加 ( 减 )。 一 个 需要 注意 的 问题 是 在 查询 语句 中 输入 日 期 。 大 部 分 系统 对 于 
世界 上 不 同 地 区 使 用 不 同 标准 的 日 期 输入 和 显示 方式 比较 敏感 。 例 如 ，5/1/2004 在 美国 是 5 月 
的 第 1 天 ， 在 欧洲 则 是 1 月 的 第 5 天 。 为 了 确保 DBMS 准 确 表达 用 户 所 要 的 日 期 ， 必 须 使 用 转换 
函数 确定 日 期 格式 。 对 于 其 他 类 型 的 数据 有 附加 的 格式 函数 ， 例 如 设置 固定 的 十 进 制 小 数 点 
或 者 显示 货币 符号 。 

DBMS 可 能 有 几 十 个 数值 函数 ， 但 是 常用 的 届 指 可 数 。 大 部 分 系统 包括 常见 的 三 角 函 数 
(比如 正弦 、 余 弦 )、 指 数 函数 等 。 大 部 分 还 支持 一 些 有 限 的 统计 计算 ,例如 平均 值 、 标 准 差 、 
偶尔 还 有 相关 、 回 归 函 数 。 一 定 要 查看 DBMS 文 档 ， 了 解 其 可 用 性 和 附加 函数 的 细节 。 然 而 ， 
记 住 ， 任 何 时 候 都 可 以 自己 编写 函数 ， 并 且 可 以 在 查询 中 使 用 ， 和 使 用 内 置 函 数 一 样 方便 。 


4.9 部 分 和 与 GROUP BY 语句 


为 了 查看 一 部 分 动物 的 总 数 ， 可 以 使 用 带 有 WHERE 子 名 的 Sum 函 数 。 例 如 ， 可 能 会 问 动 
物 列 表 中 有 多 少 只 猫 ? 查询 是 直接 的 ; SELECT Count (AnimaliD) FROM Animal Where 
(Category =“Cat”)。 运 行 后 得 到 正确 的 答案 。 然 后 返回 继续 编辑 查询 语句 ， 得 到 狗 或 者 其 他 
任何 种 类 的 动物 。 然 而 ， 频 繁 的 修改 查询 语句 令 人 生 厌 。 而 且 ， 如 果 不 知 道 所 有 的 动物 种 类 ， 
该 怎么 办 呢 ? 

考虑 更 普遍 的 查询 : 输出 每 一 种 动物 的 数量 。 如 图 4-21 所 示 ，GROUP BY 子 句 可 以 很 好 地 


第 4 章 数据 查 动 141 





解决 这 类 查询 问题 。QBE 和 SQL 都 有 这 种 技术 。SQL 语 法 简单 明了 : 只 要 加 上 GROUP BY 子 句 。 
GROUP BY 语句 只 能 和 一 个 聚集 函数 (Sum、Avg、Count 等 ) 共同 使 用 。 有 了 GROUP BY 语 
句 ，DBMS 查 看 所 有 的 数据 ， 找 到 分 组 中 的 独特 项 ， 然 后 对 分 组 中 的 每 一 项 进行 聚集 运算 。 





图 4-21 GROUP BY 计算 部 分 和 ， 计 算 每 一 种 动物 的 数量 。 这 种 方法 比 为 每 一 
种 动物 创建 一 个 WHERE 子 名 高效。 为 了 把 商务 问题 转换 到 SQL， 注 意 
by 或 for each 等 词组 ， 通 常 指定 使 用 GROUP BY 子 句 


默认 情况 下 ， 输 出 按照 分 组 项 目 排序 。 但 是 ， 对 于 商务 问题 ， 根 据 计算 排序 (ORDER 
BY) 很 常见 。 完 物 商 店 的 例子 按照 Count 排 序 ， 具 有 最 多 数量 的 动物 排 在 前 面 。 

在 GROUP BY 子 句 中 增加 多 个 列 必 须 小 心 。 对 于 整个 GROUP BY 子 句 的 每 一 个 不 同 的 项 
计算 部 分 和 。 如 果 增 加 多 个 列 (例如 : Category 和 Breed)， 会 得 到 比 预想 更 加 细致 的 分 类 。 

Microsoft 增 加 了 和 ORDER BY 语句 连用 的 一 个 有 用 的 特征 。 有 了 时 一 个 查询 会 返回 数 千 行 
结果 。 虽 然 行 已 经 排序 ， 但 是 可 能 只 需要 查看 前 几 行 。 例 如 ， 列 出 10 个 最 佳 售货员 ， 或 者 顾 
客 的 前 10%。 对 结果 排序 后 ， 可 以 用 TOP 语 名 轻松 地 限制 结果 输出 。 例 如 : SELECT TOP 10 
SalesPerson, SUM(Sales) FROM Sales GROUP BY SalesPerson ORDER BY SUM(Sales) DESC。 
这 个 查询 计算 每 一 个 销售 员 的 销售 总 额 ， 并 且 按 照 降 序 显示 列表 。 然 而 ， 只 有 前 10 行 结果 会 
显示 出 来 。 当 然 ， 可 以 用 任何 值 代替 10。 还 可 以 输入 一 个 百分数 (例如 : TOP 5 PERCENT )， 
这 样 5% 之 后 的 行 不 再 显示 。 如 果 一 个 管理 者 想 查 看 “最 好 的 ”并 且 跳 过 剩余 行 ， 这 些 查询 命 
令 十 分 有 用 。 注 意 Oracle 不 支持 TOP 条 件 。 


4.9.1 求 和 条 件 (HAVING) 


GROUP BY 子 句 功能 强大 ， 提 供 有 用 的 决策 信息 。 如 果 涉 及 到 多 个 组 ， 可 能 需要 限制 输 
出 列表 ， 尤 其 是 当 一 些 分 组 相对 较 小 。 宠 物 商店 有 有 疏 行 动物 和 蜂 蛛 类 动物 ， 但 是 它们 通常 比 
较 特 殊 。 在 分 析 销 售 时 ， 管 理 者 可 能 更 关注 卖 得 最 好 的 种 类 。 

一 种 减少 显示 数据 量 的 方法 是 增加 HAVING 子 句 。HAVING 子 句 作为 条 件 ， 控 制 GROUP 
BY 的 输出 。 在 图 4-22 的 例子 中 ， 管 理 者 想 要 跳 过 少 于 10 个 动物 的 类 别 。 注 意 SQL 语 句 只 增加 
一 行 。 同 样 的 条 件 也 可 以 加 到 QBE 查 询 的 标准 格子 中 。HAVING 子 名 功能 强大 ， 和 WHERE 有 
相似 之 处 。 保 证 加 在 计算 结果 的 条 件 是 由 GROUP BY 子 句 得 到 的 。 在 Oracle 中 ，HAVING 子 名 








是 TOP 语 句 的 一 个 可 能 的 替代 。 可 以 对 部 分 和 排序 ， 然 后 只 显示 其 中 满足 限制 条 件 的 那 部 分 。 


SELECT Category, Count(AnimaliD) AS CountOfAnimallD 
FROM Animal 

GROUP BY Category 

HAVING ”Count(AnimallD ) > 10 
ORDER BY Count(AnimaliD) DESC; 











Category Count0fAnimallD 
Dog 
Cat 


Bird 
Fish 





图 4:22 用 HAVING 子 句 限制 输出 。 带 有 Count 函 数 的 GROUP BY 子 句 可 以 计算 
每 一 种 动物 的 数量 。HAVING 子 句 限制 输出 ， 只 有 那些 多 余 10 个 动物 
的 类 别 才 输 出 


4.9.2 WHERE 子 句 与 HAVING 子 句 


开始 学 习 QBE 和 SQL 时 ，WHERE 和 HAVING 看 起 来 很 相似 ， 不 知道 选 哪 个 更 合适 。 理 解 
它们 的 不 同 非常 关键 。 如 果 输 入 有 误 ，DBMS 也 会 返回 答案 ， 但 答 非 所 问 。 

关键 在 于 WHERE 语句 应 用 于 原始 表 的 每 一 个 单独 行 。HAVING 语 句 只 应 用 于 带 有 GROUP 
BY 的 查询 语句 输出 的 部 分 和 。 为 了 增加 难度 ， 甚 至 可 以 把 WHERE 和 HAVING 子 句 结合 在 一 个 
查询 语句 中 使 用 ， 因 为 只 想 查看 部 分 数据 行 ， 并 且 限 制 输出 部 分 和 。 

考虑 图 4-23 的 问题 ， 出 生 于 2004 年 6 月 1 日 之 后 的 每 一 种 动物 的 数目 ， 但 是 只 列 出 它们 中 超 
过 10 个 的 。 这 个 查询 的 结构 和 图 4-22 的 例子 相似 。SQL 的 不 同 之 处 在 于 增加 了 WHERE 子 句 
(DateBorn > #6/1/200 矢 )。 这 个 子 句 对 原始 表 的 每 一 行 起 作用 ,决定 是 否 包括 在 计算 中 。 比 较 
图 423 所 示 狗 的 数量 是 30， 而 图 4-22 中 有 100。 只 有 30 只 狗 出 生 于 2004 年 6 月 1 日 之 后 。 由 于 
HAVING 子 名 的 限制 ， 只 有 超过 10 个 动物 的 种 类 才能 显示 。 

查询 处 理 首先 逐 行 检查 是 否 满足 WHERE 条 件 。 如 果 满 足 ， 查 看 Category， 对 应 的 种 类 计 
数 增 加 。 表 中 所 有 行 处 理 完毕 ， 检 查 总 数 是 否 满足 HAVING 条 件 。 只 有 满足 的 行 才 显示 。 

QBE 查 询 略 显 复杂 。 两 个 条 件 都 列 在 标准 格 中 。 然 而 ， 仔 细 观 察 Total 行 ， 可 以 看 到 
DateBorn 列 有 个 Where 项 。 这 一 项 就 是 用 来 区 分 HAVING 和 WHERE 条 件 的 。 为 了 保险 起 见 ， 
一 定 要 检查 SQL 语 名， 确保 查询 符合 用 户 要 求 。 
4.9.3 最 好 和 最 差 

考虑 商务 查询 : 哪 种 商品 卖 得 最 好 ? 如 何 构造 SQL 语句 来 回答 这 个 问题 ? 一 开始 ， 必 须 确 
定 “ 最 好 ”是 按照 数量 还 是 收入 (价格 乘 以 数量 ) 来 衡量 。 现 在 先 按 数量 。 常 见 查询 写法 类 似 : 


SELECT Max(Quantity) FROM SaleItem。 这 个 查询 可 以 运行 。 它 返回 数量 最 多 的 一 次 销售 ， 但 
这 个 查询 不 能 返回 总 销售 量 。 进 一 步 的 可 能 是 : SELECT ItemID, Max(Sum(Quantity)) FROM 
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SaleItem GROUP BY ItemID。 但 这 个 查询 是 不 正确 的 ， 因 为 数据 库 在 计算 总 数 前 不 能 计算 最 大 
值 。 所 以 最 佳 的 答案 是 : SELECT ItemID, Sum(Quantity) FROM SaleItem GROUP BY ItemID 
ORDER BY Sum(Quantity) DESC。 这 个 查询 计算 每 一 项 的 总 购买 量 ， 并 且 按照 降序 显示 结果 
一 一 卖 得 最 多 的 位 于 列表 最 上 面 。 





ee Count(AnimatiD ) AS CountOfAnimailiD 
DateBorn > #6/1/2004# 
Category 

Count(AnimaliD) > 10 
Count(AnimailD) DESC; 







图 4-23 WHERE 与 HAVING。 按 照 种 类 计算 在 2001 年 6 月 1 日 之 后 出 生 的 动物 的 
数目 ， 但 是 只 需要 列 出 动物 数目 大 于 10 的 动物 种 类 。WHERE 子 句 首 先 
确定 是 否 每 一 行 参 与 动物 数目 的 计算 。GROUP BY 语句 为 每 一 种 类 生 
成 动物 总 数 。 而 HAVING 子 句 则 限制 输出 结果 ， 只 有 那些 大 于 10 个 动 
物 的 种 类 才 输 出 


这 种 做 法 的 一 个 缺点 是 返回 整个 销售 表 。 一 般 而 言 ， 大 部 分 业内 人 士 不 仅 看 最 上 面 和 最 下 
面 的 项 ， 所 以 这 不 是 一 个 严重 的 问题 一 一 除非 列表 太 长 。 如 果 那 样 ， 可 以 使 用 TOP 或 HAVING 
命令 减少 列表 的 长 度 。 


4.10 多 表 


截至 目前 ， 所 有 的 例子 都 在 一 个 数据 表 上 操作 ， 这 样 做 是 为 了 集中 讨论 特定 的 话题 。 然 而 
实际 上 ， 常 需要 从 多 个 表 中 得 到 组 合 数据 。 事 实 上 ，DBMS 的 优势 在 于 组 合 多 个 表 的 数据 。 

第 3 章 展示 如 何 把 业务 表单 和 报表 分 成 有 关系 的 表 。 虽 然 规 范 化 使 数据 存储 效率 更 高 并 且 
避免 了 常见 的 问题 ， 但 最 终 回 答 业 务 问题 还 需要 把 各 个 表 的 数据 连接 起 来 。 例 如 ，Sale 表 只 包 
括 CustomerID 标 识 特定 顾客 。 大 部 分 人 更 喜欢 看 顾客 的 名 字 和 其 他 属性 。 这 部 分 数据 存储 在 
Customer 表 一 一 也 带 有 CustomerID 。 需 要 把 Sale 表 的 CustomerID 和 Customer 表 的 相应 数据 联系 
起 来 。 


4.10.1 连接 表 


在 现代 查询 语言 中 ， 连 接 多 个 表 的 数据 是 直截了当 的 。 只 要 简单 地 指定 涉及 哪些 表 和 这 些 
表 如 何 连 接 即 可 。QBE 在 此 方面 尤为 简单 。 

为 了 理解 方便 ， 首 先 考虑 图 4-24 所 示 的 查询 问题 : 列 出 在 2004 年 4 月 1 日 至 2004 年 5 月 31 日 购 
物 的 顾客 的 CustomerID。 因 为 有 的 顾客 可 能 在 几 天 内 购物 ，DISTINCT 子 名 用 于 消除 重复 元 组 。 





SELECT DISTINCT CustomeriD 

FROM Sate 

WHERE (SaieDate Between '01-Apr-2004' 
And '31-May-2004") 

ORDER BY CustomeriD; 
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图 4-24 列 出 每 一 个 在 2004 年 4 月 1 日 至 2004 年 5 月 31 日 购物 的 顾客 的 CustomerID。 
大 部 分 人 更 喜欢 看 顾客 的 名 字 和 地 址 ， 这 些 属性 存储 在 Customer 表 中 
大 部 分 管理 者 可 能 更 希望 看 到 顾客 姓名 ， 而 不 是 CustomerID 。 但 是 ， 姓 名 存储 在 
Customer 表 中 ， 因 为 把 顾客 的 所 有 属性 都 复制 到 和 顾客 相关 的 所 有 表 中 严重 浪费 空间 。 如 果 
要 打印 这 些 表 ， 必 须 把 销售 报表 的 CustomerID 和 Customer 表 的 相应 行 匹配 获得 顾客 姓名 。 当 
然 ， 手 工 匹 配 非常 耗 时 。 查 询 系统 可 以 轻松 做 到 。 
如 图 4-25 所 示 ，QBE 查 询 系统 在 某 些 方面 比 SQL 语法 要 简单 。 但 概念 是 一 致 的 。 首 先 ， 找 
到 涉及 的 两 个 表 (Sale 和 Customer)。 在 QBE 中 ， 从 列表 中 选择 表 名 ， 显 示 在 表单 的 最 上 方 。 
在 SQL 中 ， 在 FROM 行 输入 表 名 。 然 后 ， 告 诉 DBMS 每 一 个 表 的 哪些 列 匹配 。 在 本 例 中 ，Sale 
表 的 CustomerID 和 Customer 表 的 CustomerID 匹 配 。 大 部 分 情况 列 名 相同 ， 但 也 可 以 不 同 。 
SELECT DISTINCT Sale.CustomerlD, Customer.LastName 
FROM Customer 
INNER JOIN Sale ON Customer.CustomerlD = Sale.CustomerlD 


WHERE (SaleDateBetween '01-Apr-2004' And '31-May-2004') 
ORDER BY Customer.LastName; 





CustomerlD 
Phone 
FirstName 
LastName 


CustomerlD LastName 

22 Adkins 
Carter 
Franklin 




















CustomerlD | LastName [SaleDate | Froedge 
me |Sale |Customer [Sale nes 
Em | Holland 
Between '01-Apr-2004' Hopkins 

And '31-May-2004" Lee 
ii. Ey ee 


图 4-25 连接 表 运 算 导 致 基于 JOIN 语句 指定 的 列 的 匹配 。 可 以 使 用 任何 一 个 表 
的 数据 。 查 询问 题 是 : 列 出 在 2004 年 4 月 1 日 至 2004 年 5 月 31 日 间 购 物 的 
顾客 的 姓 
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在 SQL 中 ， 用 JOIN 语句 把 表 连 接 起 来 。 这 个 语 
名 在 SQL 92 的 介绍 中 改变 了 ， 可 能 会 遇 到 很 多 仍然 





FROM tablet 


INNER JOIN table2 
使 用 更 老 版 本 SQL89 语 法 的 查询 语句 。 在 SQL89 中 ， ON table1.columa = table2.coiumn 
JOIN 条 件 是 WHERE 子 名 的 一 部 分 。 大 部 分 版 本 转 SQL 92 syntax 
换 到 SQL92 语 靶 ， 所 以 本 书 基 于 该 格式 。 正 如 第 5 章 
指出 的 ，SQL92 语 法 在 需要 改变 连接 结构 时 更 为 简 WHERE tablet .column = table2.colimn 
SQL 89 syniax 


单 易 懂 。 

JOIN 的 语法 如 图 4-26 所 示 。 类 似 SQL89 的 非 正 
式 语法 也 列 出 来 了 。DBMS 不 会 接受 使 用 非 正 式 语 
法 的 语句 ， 但 是 ， 如 果 查 询 使 用 了 很 多 表 ， 先 写 出 一 
非 正 式 语 法 再 添加 必要 的 语法 细节 更 容易 一 些 。 注 “图 4-26 SQL92 和 SQL89 的 连接 表 语 法 。 非 


FROM table1, table2 
JOIN table1.column = table2.c0ltmn 


Informal syntax 











意 QBE 和 SQL 都 必须 指定 涉及 哪些 表 和 哪些 列 的 数 正式 的 语法 不 能 在 任何 DBMS 中 使 
据 匹配 用 ， 但 是 ， 当 需要 连接 很 多 表 时 ， 
这 样 做 更 方便 阅读 


4.10.2 标识 不 同 表 中 的 列 


注意 SQL JOIN 语句 中 ， 列 是 如 何 指定 的 。 因 为 列 名 CustomerID 出 现在 两 个 表 中 ， 写 成 
CustomerID = CustomerID 是 没有 意义 的 。DBMS 无 法 理解 这 句 话 的 意思 。 为 了 跟踪 指定 的 列 ， 
必须 指出 表 名 : Sale.CustomerID 。 实 际 上 ， 这 个 语法 可 以 在 任何 时 候 指定 列 。 只 有 当 多 个 表 
含有 相同 列 名 的 时 候 才 必须 使 用 完整 的 table.column 格 式 。 如 果 使 用 QBE 和 Microsoft Access ， 
就 会 发 现 它 总 包括 表 名 ， 这 是 为 了 避免 添加 表 时 引起 混淆 。 


4.10.3 连接 多 张 表 


查询 可 以 使 用 多 张 不 同 表 的 数据 。 如 果 不 考虑 表 的 数量 ， 这 一 过 程 是 类 似 的 。 每 一 个 希望 
增加 的 表 必 须 和 另 一 张 拥 有 共同 数据 列 的 表 连 接 起 来 。 如 果 不 能 找到 共同 的 列 ， 要 么 是 规范 
化 没有 做 好 ， 要 么 需要 找到 第 三 张 表 包含 和 这 两 张 表 的 连接 。 

考虑 图 4-27 的 例子 : 列 出 在 给 定 两 个 日 期 之 间 购 买 登 记过 的 白色 猫 的 顾客 姓名 和 电话 号 码 。 
一 个 重要 的 步骤 是 确定 需要 的 表 。 复 杂 的 问题 涉及 几 张 表 ， 最 好 列 出 作为 输出 的 列 和 带 有 限制 
的 列 。 在 这 个 例子 中 ， 姓 名 和 电话 号 码 是 想 要 得 到 的 ， 它 们 在 Customer 表 中 。 注 册 状 态 、 颜 色 、 
种 类 ( 猫 ) 都 在 Animal 表 中 。SaleDate 在 Sale 表 中 。 但 是 ， 连 接 这 三 张 表 ， 很 快 会 发 现 Animal 
表 不 能 和 两 外 两 张 表 连 核 。 由 于 顾客 可 以 一 次 购买 多 个 动物 ， 所 以 这 些 重复 的 数据 存储 在 另外 
一 张 表 中 ， 这 个 表 就 是 SaleAnimal， 包 括 SaleID 和 AnimalID 列 。 因 此 ， 这 个 查询 使 用 四 张 表 。 

如 果 数 据 库 包 含 大 量 表 ， 那 么 构造 复杂 的 查询 具有 相当 的 挑战 性 。 必 须 熟 悉 包含 所 需 列 的 
表 。 对 于 大 数据 库 ， 实 体 关 系 图 (ERD) 或 者 类 图 可 以 显示 表 是 如 何 连接 的 。 如 果 数 据 库 建 在 
Access， 一 定 要 在 建 表 之 前 定义 关系 。 第 3 章 阐述 了 Access 如 何 设置 外 码 关 系 的 参照 完整 性 。 
当选 定 表 时 ，Access 使 用 关系 自动 给 QBE 添 加 JOIN 运算 。 还 可 以 使 用 ERD 帮 助 用 户 构造 查询 。 

刚 开 始 ， 连 接 多 于 两 张 表 的 SQL92 语 法 看 起 来 很 复杂 。 实 际 上 ， 最 好 不 要 强 记 语 法 。 开 始 
学 习 SQL 时 ， 理 解 JOIN 的 含义 比 语法 更 为 重要 。 图 4-28 展 示 了 连接 三 张 表 的 语法 。 从 最 内 层 
的 JOIN (括号 里 ) 开始 阅读 或 创建 类 似 的 语句 。 然 后 用 相应 的 ON 条 件 增加 表 。 如 果 需 要 其 他 





的 表 ， 继 续 从 内 向 外 增加 括号 和 ON 语句 。 一 定 要 保证 新 添加 的 表 可 以 和 括号 内 的 某 个 表 连 接 。 
图 4-28 还 展示 了 一 种 可 以 速写 的 简单 语法 ， 开 始 构造 查询 或 者 在 某 种 紧急 情况 下 ， 比 如 期 中 考 
试 时 可 以 使 用 。 这 种 写法 类 似 较 老 的 SQL89 (但 不 完全 正确 ) ， 它 的 语法 是 列 出 所 有 FROM 子 
句 中 的 表 ， 然 后 再 用 WHERE 子 句 连接 它们 。 


SELECTDISTINCTROW Gustomer.LastName, Customer.Phone 

FROM Customer INNER JOIN (Sale INNER JOIN (Animal INNER JOIN SaleAnimal 
ONAnimal.AnimallD = SaleAnimal.AnimallD) ON Sale.SalelD = SaleAnimal.SalelD) 

ON customer.CustomerlD = Sale.CustomerlD 

WHERE ((Animal.Category = ‘Cat’) AND (Animal.Registered Is Not Null) 

AND (Color Like “%White%') AND (SaleDate Between ’01-Jun-2004’ And '31-Dec-2004 )); 


SalelD 
AnimallD 








| Fa | Lasame | Phone |Categoy | Registered | Color [saleDate 






[Table | customer | customer | Animal | Animal | Anmal |sae | 
FRR 于 
Wa nd i 
And ’31-Dec-2004’ 
Ve 


图 4-27 连接 多 张 表 。QBE 使 得 连接 多 张 表 相 对 简单 ， 只 要 把 表 列 在 同一 行 即 可 。 
对 于 SQL， 从 两 张 表 开始 ， 并 向 外 扩展 。 例如， 开始 用 (Animal INNER 
JOIN SaleAnimal ON Animal.AnimalID = SaleAnimal.AnimalID)， 然 后 


用 JOIN 连接 第 三 张 表 (Sale) 


SQL92 连 接 3 张 表 语法 : 
FROM Table1 


INNER JOIN (Table2 INNER JOIN Table3 ON Tabte2.ColA = Table3.ColA) 
ON Table1.ColB = Tabie2.ColB 


简单 但 不 正确 的 标记 : 
FROM Table1, Table2, Table3 


JOIN Table1.ColB = Table2.ColB 
Table2.ColA = Table3.ColA 


图 4-28 连接 多 张 表 。 按 照 SQL92 语 法 ， 首 先 连接 括号 内 的 两 张 表 ， 然 后 增加 
第 三 张 表 和 JOIN 条 件 。 如 果 集 中 在 如 何 连接 表 ， 使 用 简单 的 语法 一 一 
二 定 要 记 住 ， 为 了 计算 机 可 以 理解 ， 必 须 转换 成 SQL92 语 法 


4.10.4 表 连 接 提示 


表 连 接 和 数据 规范 化 关系 密切 。 规 范 化 把 数据 划分 成 表 以 便 高 效 存储 和 搜索 。 查 询 语句 和 
SQL 是 一 个 相反 的 过 程 : JOIN 运 算 把 表 中 的 数据 重新 连接 起 来 。 如 果 规 范 化 不 正确 ， 可 能 无 
法 连接 表 。 所 以 当 构 造 查 询 语句 时 ， 要 双重 检查 规范 化 以 保证 其 正确 性 。 初 学 者 经 常 在 JOIN 
上 遇 到 麻烦 ， 这 一 节 列 出 几 点 提示 帮助 读者 理解 潜在 的 问题 。 
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时 刻 牢记 使 用 多 张 表 必须 连接 。 有 趣 的 是 很 多 数据 库 查 询 系统 可 以 接收 没有 表 连 接 的 查 
询 。 甚 至 可 以 给 出 结果 。 不 幸 的 是 结果 通常 毫 无 意义 。 连 接 起 来 的 表 也 可 以 创建 一 个 大 的 查 
询 。 如 果 没 有 任何 限制 ， 大 部 分 查询 系统 会 产生 一 个 交叉 连接 (Cross JOIN) ， 一 个 表 的 每 一 
行 和 另 一 个 表 的 每 一 行 配对 。 在 代数 上 ， 交 叉 连 接 就 是 两 个 集合 的 笛 卡 儿 积 。 如 果 两 个 表 分 
别 有 m 行 和 n 行 ， 查 询 结果 就 有 ms#n 行 ! 

在 任何 可 能 的 地 方 双重 检查 复杂 查询 的 结果 。 使 用 样本 数据 ， 独 立 测 试用 例 ， 可 以 手工 计 
算 结果 。 也 可 以 一 步 步 地 构造 复杂 查询 。 开 始 只 要 一 两 张 表 ， 并 且 检 查 中 间 结 果 是 否 有 意义 。 
然后 添加 新 表 和 其 他 的 限制 。 最 后 添加 汇总 计算 (例如 Sum、Avg 等 )。 只 通过 一 个 数据 (总 
数 ) 判定 正确 性 很 困难 。 相 反 ， 观 察 中 间 结 果 列 表 并 且 确 保 它 包 括 所 有 想 要 的 行 ， 然 后 添加 
其 他 计算 请 求 。 

用 在 JOIN 运算 中 的 列 经 常 作为 主 码 列 ， 但 是 也 可 以 使 用 任何 列 连 接 表 。 类 似 地 ， 连 接 的 
列 可 以 有 不 同 的 名 字 。 例 如 ， 可 以 把 Employee.EmployeeID 列 和 Sale.SalesPerson 列 连接 起 来 。 
惟一 的 技术 限制 是 这 两 个 列 必须 具有 相同 的 数据 类 型 ( 域 ) 。 某 些 情况 下 ， 可 以 通过 函数 转换 
数据 降低 限制 。 例 如 ， 可 以 使 用 Left(ZipCode,5) = ZipCode5 把 9 位 的 邮政 编码 字符 串 转换 为 5 位 
数字 。 一 定 要 保证 两 列 数据 匹配 是 有 意义 的 。 例 如 ， 连 接 表 条 件 为 Animal.AnimalID = 
Employee.EmployeeID 毫 无 意义 。DBMS 事 实 上 接受 了 JOIN (如 果 两 个 ID 值 都 是 整数 ) ， 但 是 
JOIN 没有 任何 意义 ， 因 为 一 个 Employee 永 远 不 是 一 只 Animal (除非 是 科幻 电影 ) 。 

避免 表 之 间 的 多 连接 。 对 于 Access， 如 果 事 先 定义 了 表 之 间 的 关系 ， 那 么 这 个 问题 经 常 出 
现 。AccessQBE 自 动 使 用 这 些 关系 连接 查询 中 的 表 。 如 果 选 择 如 图 4-29 所 示 的 4 张 表 ， 去 掉 所 有 
四 个 JOIN 运 算 , 将 无 法 获得 想 要 的 答案 。 四 个 JOIN 语 句 返 回 AnimalOrders， 只 有 Employee 设 置 
的 订单 具有 和 Supplier 相 同 的 CityID! 如 果 只 需要 Supplier 的 City， 解 决 方案 删除 Employee 和 City 
的 JOIN 运算 。 一 般 来 说 ， 如 果 查 询 使 用 四 张 表 ， 那 么 会 有 三 个 JOIN 运算 ( 比 表 的 数量 少 一 ) 。 





ShippingCost 
EmployeelD 







Pe 
六 汪 条 各 条 关 、、) 让 基 芝 生生 村 


图 4-29 这 个 查询 涉及 4 张 表 和 四 个 JOIN 运 算 ， 它 返回 Employee 和 Supplier 具 有 
相同 CityID 的 行 。 如 果 只 需要 供应 商 的 城市 ， 删 除 Employee 和 CityID 
之 间 的 JOIN 即 可 。 如 果 两 个 城市 都 需要 ， 那 么 增加 另 一 个 City 表 作为 
第 五 张 表 
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4.10.5 表 的 别名 


仔细 考虑 前 面 的 例子 。 如 果 想 同时 显示 Supplier 的 City 和 Employee 的 City 该 怎么 办 ? 当然 ， 
人 允许 城市 不 同 。 答 案 用 到 了 SQL 的 一 个 小 技巧 : 增加 第 二 张 City 表 。 第 二 张 “副本 ”具有 不 同 
的 名 字 (例如 : City2)。 在 FROM 子 名 中 给 表 一 个 新 的 名 字 (别名 ): FROM City AS City2。 
如 图 4-30 所 示 ，City 表 和 Supplier 表 连接 起 来 。City2 表 连接 到 Employee 表 。 这 样 ， 查 询 在 同一 
张 表 上 执行 了 两 次 独立 的 JOIN 运 算 一 一 仅仅 因为 有 了 不 同 的 名 字 。 


OrderDate 
SupplieriD 
ShippingCost 


EmployeelD 





SELECT Supplier. SID, Supplier.CitylD, City.City, Employee.EID, 

Employee.Last Name, Employee.CityID, City2.City 

FROM (City INNER JOIN Supplier ON City.CityiD = Supplier.CityID) INNER JOIN 
((City AS City2 INNER JOIN Employee ON City2.CitylD = Employee.CityID) 
INNER JOIN AnimalOrderON Employee.EmployeelD = AnimalOrder.EmployeelD) 
ON Supplier.SupplierlD = Animal0rder.SupplierlD， 


SID Supplier.CityiD 由 EID LastName Employee.CitylD y2:6it 

4 Middlesboro \ 5 James 7083 
2 10896 Springfield 1 Reeves 9201 incoln 

4 7972 Middlesboro 3 Reasoner 8313 Springfield 
9 10740 Columbia 8 Carpenter 10592 Philadelphia 
5 10893 Smyrna 3 Reasoner 8313 Springfield 


图 4-30 表 的 别名 。City 表 使 用 了 两 次 。 第 二 次 指定 别名 City2， 并 且 作为 独立 
的 表 对 待 。 因 此 ， 可 以 检索 不 同城 市 的 Supplier 和 Employee 


4.10.6 创建 视图 


查询 可 以 作为 视图 保存 。 微 软 直接 把 它 叫 做 存储 的 查询 ， 但 是 SQL 和 Oracle 叫 做 视图 。 不 
论 哪 种 情况 ，DBMS 分 析 并 存储 SQL 语句 ， 方 便 以 后 使 用 。 如 果 一 个 查询 需要 多 次 运行 ， 就 应 
该 作为 视图 存储 ， 这 样 DBMS 只 需 分 析 一 次 。 图 4-31 展 示 了 创建 视图 的 基本 SQL 语 法 。 以 
SELECT 语 句 开 头 ， 并 且 增 加 一 行 (CREATE VIEW…)。 


CREATE VIEW Kittens AS 
SELECT * 


FROM Animal 
WHERE (Category = ‘Cat’ AND (TodayDateBorn < 180); 





图 4-31 视图 。 视图 是 可 以 在 任何 时 候 运行 的 存储 的 查询 。 可 以 提高 性 能 ， 因 
为 用 户 只 需 输入 一 次 ，DBMS 也 只 需 分 析 一 次 
视图 最 强 天 的 特征 在 于 它 可 以 和 其 他 查询 配合 使 用 。 对 于 多 次 运行 的 查询 , 视图 非常 有 用 。 
也 可 以 创建 视图 解决 复杂 的 问题 。 用 户 可 以 基于 视图 创建 新 的 简单 的 查询 。 在 图 4-31 的 例子 中 ， 
创建 视图 (Kittens)， 显 示 在 最 近 180 天 内 出 生 的 猫 的 数据 。 如 图 4-32 所 示 ， 用 户 可 以 基于 诸如 
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颜色 等 其 他 条 件 搜索 视图 Kittens 。 SELECT Avg (Listprice) 

如 果 仅 仅 使 用 视图 显示 数据 ， 那 么 很 简单 。 FROM Kittens 
但 是 ， 如 果 希 望 用 视图 更 新 数据 ,那么 必须 小 心 。 | ER 《Co1or LIKE '%Blacks'); 
可 能 无 法 更 新 视图 中 的 部 分 数据 列 ， 这 取决 于 如 图 4-32 基于 视图 的 查询 。 视 图 可 以 和 其 他 查 
何 创建 视图 。 图 4-33 是 一 个 更 新 视图 的 例子 。 目 询 配合 使 用 
的 是 增加 新 的 定购 数据 项 。 用 户 输入 OrderID 和 ItemID 。 该 Item 的 相应 描述 自动 从 Item 表 搜索 
得 到 。 











Orderltem(OrderlD, itemlD, Quantity) tem(ltemlD, Description) 





OrderLine(OrderlD, ltemlD, Description, Quantity) 





图 4-33 更 新 视图 。 视 图 OrderLine 设 计 为 在 一 张 表 (OrderItem) 上 更 新 数据 。 
item 表 的 Description 列 用 于 显示 ， 帮 助 用 户 检查 ItemID 输 入 的 正确 性 


图 4-34 举 例 说 明 如 果 草 率 地 选择 视图 的 列 会 遇 到 的 麻烦 。 这 里 OrderLine 视 图 使 用 Item 表 
(而 不 是 OrderItem 表 ) 的 ItemID 值 。 这 样 不 能 给 OrderLine 视 图 增加 新 的 数据 。 为 了 理解 其 中 
的 原因 ， 考 虑 试图 把 ItemID 从 57 改 为 32 会 发 生 什 么 。 如 果 执 行 该 更 新 ， 新 值 存储 在 Item 表 ， 仅 
仅 把 猪 食 的 ItemID 从 57 改 为 32。 









Orderitem(Order!D, iemlD, Quantity) ltem(ltemiD, Descriptiom) 









121 57 3 57 Cat food 
121 82 2 58 Dog food 
122 57 1 59 Bird food 








OrderLine(OrderlD, ltem.itemliD, D' 








Bird feeder 2 
Cat food 


图 4-34 不 可 更 新 的 视图 。 不 要 把 不 同 表 的 主 码 混 在 一 起 。 如 果 这 个 视图 运行 ， 
结果 并 不 是 想 要 的 。 如 果 把 ItemID 从 57 改 为 32， 那 么 更 改 的 仅仅 是 猫 
食 的 ItemID。 不 能 向 OrderItem 表 增加 新 数据 
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为 了 保证 视图 是 可 更 新 的 ， 必 须 设计 它 只 改变 一 张 表 中 的 数据 。 其 余数 据 只 用 于 显示 
例如 检查 用 户 输入 的 ItemID 是 否 正确 。 视 图 涉及 的 主 码 列 决 不 能 多 于 一 张 表 。 还 有 ， 为 了 保持 
可 更 新 性 ， 视 图 不 能 使 用 DISTINCT 关 键 字 、GROUP BY 和 HAVING 子 句 。 

视图 在 数据 库 中 用 途 广泛 。 特 别 是 帮助 业务 管理 者 和 数据 库 打交道 。 数 据 库 管理 员 (DBA) 
或 者 信息 系统 (IS) 工作 人 员 可 以 为 业务 管理 者 创建 视图 ， 他 们 只 需要 查看 以 视图 形式 显示 的 
那 部 分 数据 。 因 此 ， 可 以 隐藏 视图 的 复杂 性 和 大 小 。 最 重要 的 是 ， 可 以 隐藏 构造 视图 所 用 的 
JOIN 运算 。 这 样 管理 者 只 需 面 对 简单 的 限制 。 通 过 保持 视图 更 新 ， 管 理 者 不 再 需要 原始 表 。 

注意 有 的 数据 库 系 统 限制 视图 可 以 使 用 的 命令 。 例 如 ， 老 版 本 的 Oracle 和 新 版 本 的 SQL 
Server 系 统 不 允许 用 户 在 一 个 存储 的 视图 中 使 用 ORDER BY 子 句 。 这 样 限制 的 原因 是 系统 可 以 
优化 查询 提高 效率 。 为 了 对 结果 分 类 ， 必 须 对 新 的 查询 增加 新 的 ORDER BY 语句 ， 这 个 查询 
叫做 保存 的 视图 。 最 后 ， 不 论 如 何 仔细 地 用 JOIN 语句 构造 视图 ，DBMS 都 不 允许 更 新 。 如 有 果 
DBMS 人 允许 ， 那 么 可 更 新 视图 可 以 在 建 表 单 时 节省 一 些 时 间 。 但 是 ， 在 其 他 情况 下 ， 必 须 放 弃 
并 且 使 用 简单 表单 。 


小 结 


创建 查询 的 关键 是 回答 四 个 问题 ，(1) 想 要 得 到 什么 ? (2) 有 什么 限制 ? (3) 涉及 哪 
些 表 ? (4) 这 些 表 如 何 连 接 ? 创建 查询 的 本 质 就 是 使 用 这 四 个 问题 获得 正确 的 逻辑 。 
WHERE 子 句 通常 是 错误 的 来 源 。 一 定 要 理解 查询 的 目标 。 用 OR 和 AND 连 接 语句 ， 以 及 使 用 
德 摩根 定律 化 简 条 件 时 一 定 要 小 心 。 

要 不 断 地 对 查询 进行 测试 。 构 造 复杂 查询 最 好 的 办 法 就 是 从 简单 查询 开始 ， 然 后 增加 表 。 
每 次 增加 一 个 条 件 ， 并 且 检 查 结果 是 否 正确 。 最 后 输入 计算 请 求 和 GROUP BY 子 句 。 当 进行 计 
算 时 ,一 定 要 准确 理解 Sum 和 Count 的 区 别 。 记 住 Count 仅 仅 对 行 计 数 ，Sum 对 特定 列 的 值 求 和 。 

连接 表 是 直截了当 的 。 一 般 最 好 的 办 法 是 使 用 QBE 指 定 连接 表 的 列 ， 然 后 检查 SQL 命令 的 
语法 。 记 住 JOIN 连接 的 列 可 以 有 不 同 的 名 称 。 还 有 ， 在 没有 公共 列 的 情况 下 ， 需 要 增加 第 三 
个 (或 者 第 四 个 ) 表 把 两 张 表 连接 起 来 。 时 刻 保持 类 图 在 手边 ， 有 助 于 确定 要 使 用 哪些 表 以 
及 这 些 表 是 如 何 相互 连接 的 。 





关键 词 


聚集 DESC 示例 查询 (QBE) 
别名 DISTINCT 逐 行 计算 
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BETWEEN FROM ORDER BY 
布尔 代数 GROUP BY SELECT 
数据 定义 语言 (DDL) HAVING SQL 

数据 操纵 语言 (DML) JOIN TOP 

德 摩根 定律 LIKE 视图 

交叉 连接 (Cross JOIN) NOT WHERE 

NULL 
复习 题 


1. 创建 查询 的 四 个 问题 是 什么 ? 

2. SQL SELECT 命令 的 基本 结构 是 什么 ? 

3. DISTINCT 运 算 符 的 目的 是 什么 ? 

4. 在 复杂 的 (布尔) WHERE 子 句 中 使 用 括号 为 什么 重要 ? 

5. 德 摩根 定律 的 内 容 是 什么 ? 它 如 何 化 简 条 件 ? 

6. ORDER BY 和 GROUP BY 命令 的 区 别 是 什么 ? 

7. SQL 的 基本 算术 运算 符 〈+、-- 等 ) 和 豪 集 函数 (SUM 等 ) 有 何不 同 ? 

8. 在 SELECT 命令 中 可 以 使 用 哪些 基本 的 聚集 函数 ? 

9. Count 和 Sum 有 何 区 别 ? 分 别 举例 说 明 如 何 使 用 。 
10. WHERE 和 HAVING 子 名 有 何 区 别 ? 分 别 举例 说 明 如 何 使 用 。 
11. SQL 连接 两 张 表 的 语法 是 什么 ? 


练习 


Sally 的 宠物 商店 
回答 下 面 编号 为 1~25 的 问题 ， 基 于 宠物 商店 数据 库 中 的 表 ， 请 写 出 SQL 语句 。 
1. 列 出 在 5 月 份 出 生 的 猫 。 
2. 列 出 在 6 月 份 的 前 7 天 在 商店 购物 的 顾客 。 
3. 7 月 份 卖 出 的 最 昂贵 的 一 项 是 什么 ? 
4. 哪些 供应 商 在 发 出 订单 后 超过 10 天 到 达 ? 
5. 列 出 库存 少 于 10 的 项 。 


6. 列 出 棕色 并 且 花 费 少 于 300 美 元 的 猫 ， 或 者 棕色 雌性 并 且 价格 低 于 150 美 元 的 动物 。 


7. 12 月 份 卖 出 动物 的 总 额 是 多 少 ? 
8. 10 月 份 卖 出 多 少 只 猫 ? 
9. 哪个 雇员 在 4 月 份 订购 来 自 田纳西 州 供应 者 的 商品 ? 
10. 列 出 卖 鸟 给 Sally 完 物 商 店 的 内 布 拉 斯 加 州 供应 商 。 
11. 8 月 份 下 了 最 大 订单 的 是 哪个 雇员 ? 
12. Sally 的 顾客 来 自 哪 个 州 的 最 多 ? 
13. 7 月 份 宠物 商店 卖 给 哪个 州 的 商品 〈 按 价格 计算 ) 最 多 ? 
14. 列 出 向 Reasoner 提 交 报 表 的 雇员 。 
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15. 列 出 从 Gibson 购买 猫 的 顾客 。 

16. 商店 是 否 在 第 一 个 季度 卖 出 更 多 的 猫 或 狗 ? 

17. 商店 是 否 在 第 四 个 季度 卖 出 更 多 的 雌性 或 雄性 动物 ? 
18. 列 出 1 月 份 卖 出 的 登记 过 的 白色 的 狗 。 

19. 哪个 供应 商 在 第 一 季度 卖 给 宠物 商店 的 货物 最 多 ? 
20. 哪个 雇员 在 7 月 和 8 月 卖 出 的 货物 最 多 ? 

21. 哪些 猫 被 预订 了， 也 就 是 说 在 订购 前 已 经 卖 完 ? 

22. 哪些 动物 低 于 成 本 卖 出 ? 

23. 哪些 猫 的 售 价 至 少 高 于 成 本 50%? 

24. 对 于 每 一 个 商品 供应 商 来 说 ， 平 均 运 输 成 本 是 多 少 ? 
25. 第 三 季度 ， 在 超过 5 个 单元 的 订单 中 ， 哪 一 项 商品 订购 次 数 最 多 ? 





Rolling Thunder 自 行车 

下 面 编号 为 26~50 的 问题 是 基于 Rolling Thunder 数 据 库 中 的 表 ， 写 出 SQL 语句 给 出 答案 ， 并 用 
Access 实 现 查询 。 

26. 列 出 2003 年 9 月 来 自 加 利 福 尼 亚 购 买 红色 山地 车 的 顾客 。 

27. 列 出 2001 年 在 没有 零售 商 帮助 的 情况 下 ， 卖 出 赛车 运送 到 威斯康星 州 的 雇员 。 

28. 列 出 2002 年 佛罗里达 州 装 有 后 变速 器 的 公路 自行 车 。 

29. 谁 2004 年 在 乔治 亚 州 购买 了 最 大 的 (框架 尺寸 ) 全 避 震 山地 自行 车 ? 

30. 哪个 厂商 2003 年 在 一 个 订单 中 给 Rolling Thunder 以 最 大 的 折扣 ? 

31. 自 2000 年 1 月 1 日 起 ， 哪 个 顾客 在 购买 赛车 时 得 到 了 最 大 的 折扣 比例 ? 

32. 哪个 雇员 在 山地 自行 车 上 安装 了 最 多 的 头 戴 耳 机 ? 
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33. 哪个 非 美 国 公司 接受 了 最 多 的 订单 ? 
34. 在 Rolling Thunder 库 存 超过 200 件 的 公路 自行 车 部 件 中 ， 哪 个 最 贵 ? 
35. 按照 估计 成 本 ， 哪 种 存货 项 占用 了 最 多 的 资金 ? 













CustomeriD 
ModelType 
PaintiD 
FrameSize 
OrderDate 






StartDate 
ShipDate 
ShipEmployee 
FrameAssem| 


bler 
Painter 









TransDate 
EmpioyeelD 
Amount 
Deseription 
Reference 










PurchaselD 
EmployeelD 


TotalList 
Shipping Cost 
Discount 





OrderDate 
ReceiveDate 
AmountDue 


CitylD 
BalanceDue 


36. 一 个 雇员 一 天 最 多 安装 多 少 个 部 件 ? 

37. 2003 年 赛车 最 流行 的 字体 风格 是 什么 ? 

38. 哪个 顾客 在 本 公司 花费 最 多 ，2002 年 这 个 人 买 了 多 少 辆 自行 车 ? 

39. 从 2003 年 到 2004 年 ， 山 地 自行 车 (全 避 震 或 无 避 震 ) 销售 增长 了 还 是 减少 了 ( 按 数 量 计算 ， 
而 不 是 价格 ) ? 

40. 2003 年 公司 在 哪个 部 件 上 花费 最 多 ? 

41. 2003 年 5 月 ， 哪 个 雇员 上 红色 的 赛车 最 多 ? 

42. 2003 年 加 利 福 尼 亚 哪 个 自行 车 商店 帮助 销售 了 最 多 的 自行 车 ( 按 价格 计算 ) ? 

43. 自行 车 11356 所 有 部 件 的 总 重 是 多 少 ? 

44. 2002 年 Campy Record 组 所 有 项 目的 总 价 是 多 少 ? 

45. 2003 年 ， 还 有 其 他 赛车 是 用 碳 质 钢 或 钛 质 钢 制造 的 吗 (以 下 管 为 准 ) ? 

46. 2001 年 Shimano XTR 后 变速 器 的 平均 价格 是 多 少 ? 

47. 1999 年 制造 的 54cm (框架 尺寸 ) 公路 自行 车 的 平均 上 管 长 度 是 多 少 ? 





754 党 二 部 分 查 坊 


48. 平均 来 看 ， 哪 种 轮胎 的 价格 更 高 ， 公 路 轮胎 还 是 山地 轮胎 ? 
49. 2003 年 5 月 ， 哪 些 雇员 卖 出 的 公路 自行 车 是 由 他 们 自己 喷漆 的 ? 
50. 2002 年 ， 着 色 时 上 英语 字体 更 流行 吗 ? 
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附录 SQL 语法 
修改 表 


ALTER TABLE table 
ADD COLUMN column datatype (size) 


DROP COLUMN colunm 





提交 任务 


COMMIT WORK 


创建 索引 


CREATE [UNIQUE] INDEX index 
ON table (columnT， coilumm2, ...})} 


WITH {PRIMARY |DISALLOW NULL|IGNORE NULL)} 
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创建 表 


CREATE TABLE table 
( 


column1l datatype (size) {NOT NULL] [index1], 
column2 datatype (size) [NOT NULL] [index2}, 


CONSTRAINT pkname PRIMARY KEY (column, ...)， 
CONSTRAINT fkname FOREIGN KEY (column) 
REFERENCES existing table (key_column) 





创建 触发 器 


CREATE TRIGGER triggername {BEFORE |AFTER} 
{DELETE | INSERT | UPDATE } 
ON table {FOR EACH ROW} 
{program code block} 





创建 视图 


CREATE VIEW viewname AS 
SELECT 


DELETE 
FROM table 
WHERE condition 


INDEX index ON table 
TABLE 

TRIGGER 

VIEW 


INSERT INTO table (colummi, column2, 
VALUES (valuel, value2, ...) 


INSERT INTO newtable (columnl, column2, 
SELECT 
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GRANT privilege Privileges 
ON object ALL, ALTER, DELETE, INDEX， 
TO user |PUBLIC INSERT, SELECT, UPDATE 


REVOKE privilege privileges 
ON object ALL, ALTER, DELETE, INDEX., 
FROM user|PUBLIC INSERT, SELECT, UPDATE 


SAVEPOINT savepoint 


ROLLBACK WORK 
TO savepoint 


SELECT DISTINCT table.column {AS alias}, 
FROM table/view 

INNER JOIN table/view ON Ti.ColA = T2.ColB 
WHERE (condition) 

GROUP BY column 

HAVING (group condition) 

ORDER BY table.column 

{UNION, INTERSECT, EXCEPT, 





选择 创建 


SELECT column1, column2, 
INTO newtable 

FROM tables 

WHERE condition 


UPDATE table 
SET columnt = vailuel, column2 = value2, 
WHERE condition 











高 级 在 询 和 了 于 查询 


本 章 学 习 内 容 
"什么 是 子 查 询 ? 
* 如 何 找到 列表 中 没有 的 东西 ? 
“ 当 某 些 项 只 在 一 个 表 中 时 ， 如 何 连接 表 ? 
* 什么 时 候 一 个 表 需 要 与 自己 连接 ? 


“。SQL 可 以 用 来 更 新 和 删除 数据 吗 ? 
5.1 开发 漫谈 
Ariel; 上 别 ! Miranda。 你 看 起 来 好 高 兴 啊 | 
Miranda: 是 啊 。 查 询 系统 太 棒 了 。 它 对 管理 员 很 有 帮助 。 每 次 提出 请 求 ， 它 都 可 以 回 
答 它 所 知道 的 一 切 。 他 们 不 再 每 天 找 我 要 结果 了 。 而 且 ， 我 知道 查询 系统 和 
数据 规范 化 是 如 何 关联 的 。 规 范 化 以 后 ， 可 以 把 表 分 开 ， 以便 数据 库存 储 。 
现在 查询 系统 可 以 重新 连接 以 获得 答案 。 
Ariel， 也 就 是 说 你 已 经 可 以 创建 应 用 程序 了 ? 
Miranda: 差不多， 但 还 没有 完全 准备 好 。 昨 天 ， 我 的 叔叔 问 了 一 个 问题 ， 我 不 知道 怎 
么 回答 。 
Ariel， 真 的， 我 本 以 为 你 可 以 用 SQL 做 任何 事情 。 你 遇 到 什么 问题 了 ? 
Miranda: ”比如 查询 哪些 顾客 上 个 月 没有 订购 任何 东西 。 我 试 了 多 次 ， 结 果 就 是 不 对 。 
Ariel. 好 像 不 难 解决 。 
Miranda: 我 知道 。 我 可 以 找到 顾客 列表 和 除了 上 个 月 之 外 的 订单 。 但 是 每 次 连接 
Customer 表 和 Order 表 ， 得 到 的 总 是 发 出 订单 的 顾客 。 我 不 知道 怎么 找到 不 存 
在 的 东西 。 
5.2 简介 


第 4 章 描述 了 SQL SELECT 语句 的 基本 部 分 。 现 在 可 以 深入 学 习 更 加 复杂 的 查询 了 。 
SQLSELECT 命 令 最 强大 的 特征 是 子 坦 询 或 嵌 套 查询 。 这 个 特征 使 得 用 户 可 以 提出 更 加 复杂 的 
问题 ， 同 时 检索 不 同类 型 的 数据 或 不 同 数据 源 上 的 数据 。SQL 不 仅仅 是 一 种 查询 语言 。 它 可 以 
创建 整个 数据 库 (数据 定义 语言 )。SQL 还 有 可 以 改变 数据 的 命令 (数据 操纵 语言 )。 
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学 习 如 何 使 用 子 查 询 关 键 在 于 两 点 ，(1) SQL 设计 对 数据 集合 进行 操作 
虑 问题 ，(2) 可 以 把 婴 套 的 查询 分 解 成 相互 独立 的 部 分 ,分别 处理 每 一 部 分 。 

第 4 章 讲 过 的 SQL 特征 已 经 非常 强大 。 为 什么 还 要 继续 学 习 更 多 的 特征 呢 ? 考虑 Sally 宠 物 
商店 这 样 一 个 常见 问题 : 哪些 动物 没有 卖 出 ? 考虑 如 何 使 用 现 有 的 SQL 知识 回答 这 个 问题 。 第 
一 步 选择 表 ， 可 能 选择 SaleAnimal 和 Animal。 第 二 ， 选 择 输出 列 : AnimalID 和 Name。 第 三 ， 
指定 条 件 。 第 四 ， 连 接 表 。 在 这 个 例子 中 ， 最 后 两 步 带 来 了 最 多 的 问题 。 如 何 找 到 没有 卖 出 
的 动物 ”不 能 指向 任何 SaleAnimal 表 中 的 动物 。 因 为 动物 在 卖 出 之 前 ， 不 会 出 现在 SaleAnimal 
表 中 。 

实际 上 ， 第 四 步 (连接 表 ) 会 带 来 更 多 的 问题 。 假 设 查询 语句 如 下 : SELECT AnimalID ， 
Name FROM Animal INNER JOIN SaleAnimal ON (Animal.AnimalID = SaleAnimal.AnimalID)。 
这 个 JOIN 条 件 去 掉 了 所 有 符合 查询 请 求 的 动物 。JOIN 子 句 限制 输出 一 和 WHERE 子 句 类 似 。 
在 这 个 例子 中 ， 告 诉 DBMS 返 回 同 时 在 Animal 和 SaleAnimal 表 中 出 现 的 动物 。 但 是 只 有 卖 出 的 
动物 才 列 在 SaleAnimal 表 中 ， 所 以 这 个 查询 永远 不 能 返回 任何 没有 卖 出 的 动物 。 

下 面 儿 节 描述 这 个 问题 的 两 种 解决 方案 固定 JOIN 语句 ， 这 样 它 不 再 作为 限制 条 件 ; 或 
者 使 用 子 查询 。 


5.3 Sally 的 宠物 商店 


图 $-1 列 出 了 Sally 出 于 业务 需要 而 必须 回答 的 问题 。 再 次 考虑 如 何 使 用 第 4 章 学 习 的 基本 
SQL 语句 回答 这 些 问 题 。 这 些 问 题 初 看 上 去 并 不 难 。 但 是 ， 甚 至 最 简单 的 问题 一 一 找到 高 于 平 
均 价 格 卖 出 的 猫 一 也 比 看 上 去 要 难 。 所 有 这 些 问 题 需要 附加 工具 : 子 查询 。 


不 要 按照 行 考 


2004 年 10 月 1 日 库存 多 少 只 猫 ? 
哪些 猫 的 售 价 高 于 平均 价格 ? 
哪些 动物 的 售 价 高 于 该 种 类 的 平均 价格 ? 


哪些 动物 没有 卖 出 ? 
哪些 顾客 (至 少 买 过 一 次 东西 ) 在 2004 年 11 月 1 日 至 2004 年 12 月 31 日 之 间 没 有 买 任何 东西 ? 
吾 些 买 过 狗 的 顾客 买 过 猫 的 配套 产品 〈 任 何 时 候 ) ? 





图 5-1 较 难 的 问题 。 即 使 这 些 问 题 很 少 限 制 ， 但 更 为 复杂 。 为 了 回答 这 些 问 题 ， 
需要 使 用 子 查询 或 外 连接 


5.4 于 查询 
5.4.1 计算 或 简单 查找 


也 许 查看 子 查询 值 的 最 简单 方式 是 考虑 相对 简单 的 问题 ， 哪些 猫 的 售 价 高 于 猫 的 平均 价 
格 ? 如 果 已 经 知道 猫 的 平均 售 价 (假定 为 170 美 元 )， 查 询 将 变 得 非常 简单 ， 如 图 5-2 的 上 半 部 
所 示 。 

如 果 不 知道 猫 的 平均 SalePrice， 可 以 用 一 个 基本 查询 把 它 查 出 来 。 把 结果 写 在 纸 上 ， 然 后 
运行 原来 的 查询 。 但 是 ， 使 用 子 查询 ， 可 以 更 进一步 ， 查询 结果 (平均 值 ) 可 以 直接 传送 给 原 
来 的 查询 。 用 图 5-2 下 半 部 所 示 的 完整 的 SELECT AVG 查 询 代替 值 《170 美 元 )。 实 际 上 ， 任 何 
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时 候 想 插入 一 个 值 或 者 比较 ， 都 可 以 使 用 子 查 询 来 代替 。 甚 至 可 以 深入 多 层 ， 所 以 子 查 询 可 以 
包含 另 一 个 子 查询 ， 如 此 等 等 。DBMS 通 常 先 计算 最 内 层 的 查询 ， 然 后 把 结果 返回 给 更 高 层 。 
2 哪些 猫 的 售 价 高 于 猫 的 平均 售 价 ? 


4 假定 已 知 平均 价格 是 170 美 元 。 
4 通常 需要 先 计算 得 到 。 


SELECT SaleAnimal. AnimallD, Animal.Category, SaleAnimal.SalePrice 
FROMAnimal 


INNER JOIN SaleAnimal ON Animal. AnimallD = SaleAnimal. AnimallD 
WHERE ((Animal.Category="Cat") AND (SaleAnimal.SalePrice>170)); 


SELECT SaleAnimal. AnimallD, Animal.Category, SaleAnimal. SalePrice 
FROM Animal 
INNER JOIN SaleAnimal ON Animal. AnimallD = SaleAnimal. A 
WHERE ((Animal.Category="Cat") AND (SaleAnimal.SalePrice> 
( SELECT AVG(SalePrice) 
FROM Animal 
INNER JOIN SaleAnimal ON Animal. AnimallD = SaleAnimallD 
WHERE (Animal.Category="Cat") ) ) ); 





图 5- 


iD 


计算 子 查 询 。 如 果 不 知道 猫 的 平均 SalePrice ， 可 以 使 用 查询 语句 计算 该 
值 。 使 用 子 查询 ， 可 以 把 计算 结果 直接 放 在 原 查 询 中 (用 括号 中 的 子 查 
询 代替 原 查询 中 的 170) 


使 用 子 查询 时 两 个 有 用 的 经 验 是 : 格式 上 突出 子 查询 ， 方 便 阅 读 ; 在 插入 主 查询 之 前 对 子 
查询 测试 。 幸 运 的 是 ， 大 部 分 现代 数据 库 系统 可 以 非常 简单 地 创建 子 查询 ， 然 后 剪 切 、 粘 贴 
SQL 到 主 查 询 中 。 类 似 地 ， 如 果 复 杂 查 询 出 了 问题 ， 把 内 层 的 子 查询 拿 出 来 ， 单 独 测试 。 


5.4.2 子 查询 和 数据 集合 


部 分 SQL 运算 符 (IN、ALL、ANY、EXISTS) 经 常 和 子 查询 一 起 使 用 。 为 了 便于 理解 ， 


暂且 不 谈 子 查询 ， 从 简单 的 数字 开始 。 考 虑 图 5-3 相 对 简单 的 例子 。 列 出 所 有 购买 下 列 商品 之 
一 : 1，2，30，32，33 的 顾客 。 4 


SELECT Customer.LastName, Customer.FirstName, Saleltem. ltemID 

FROM (Customer INNER JOIN Sale ON Customer.CustomeriD = Sale.CustomerID) 
INNER JOIN SaleltemON Sale.SalelD = Saleltem.SalelD 

WHERE (Saleltem.ltemlD In (1,2,30,32,33)) 

0RDER BY Customer.LastName, Customer.FirstName; 













Mseending| | 
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LO 


集合 与 相关 的 查询 (In) 。 可 以 使 用 OR 语 句 ， 但 是 IN 运算 符 更 简单 。 如 
果 ItemID 匹 配 相关 列表 中 的 任何 ID， 那 么 WHERE 条 件 为 真 。 列 出 所 有 
购买 下 列 项 目 (1，2，30，32，33) 的 顾客 
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读者 可 能 考虑 用 基本 SQL 语句 回答 这 个 问题 。 在 WHERE 语句 中 使 用 许多 OR 连 接 符 。 可 能 
的 写法 如 下 ;ItemID = 1 OR ItemID =2 OR ItemID = 30。 虽 然 这 种 办 法 对 于 这 个 简单 的 例子 有 
效 ， 但 是 它 增加 了 额外 的 输入 。 更 好 的 办 法 是 把 该 列表 看 作 一 个 数据 集合 ， 使 用 IN 运 算 符 : 
WHERE ItemID IN (1,2,30,32,33)。 如 果 ItemID 匹 配 集合 中 任何 一 个 数值 ， 条 件 为 真 。 

虽然 这 个 例子 中 IN 运算 符 减 少 了 输入 工作 ， 它 实际 上 有 更 强大 的 功能 。 主 要 在 于 列表 中 
的 数据 可 以 从 子 查询 获得 。 例 如 ， 管 理 者 可 能 想 知 道 哪些 顾客 买 了 和 猫 相 关 的 商品 。 虽 然 可 
以 通过 查看 所 有 的 ItemID 值 找到 和 猫 相关 的 产品 ， 但 是 让 DBMS 来 做 更 为 合适 。 只 要 修改 
WHERE 子 句 为 ; ItemID IN (SELECT ItemID FROM Merchandise WHERE Category = 
“Cat”)。 

注意 IN 运算 符 的 一 个 关键 性 特征 : 列表 中 的 值 必 须 和 测试 变量 具有 相同 的 数据 类 型 ( 域 )。 
图 $-4 的 例子 把 SaleItem.ItemID 和 SELECT ItemID 上 比较。 类似 JOIN 语句 ，IN 运 算 符 比较 相近 类 
型 的 数据 。 例 如 ， 把 ItemID 和 EmployeeID 比 较 得 到 的 结果 毫 无 意义 。 实 际 上 ，HN 运 算 符 可 以 
代替 JOIN 语句 一 虽然 JOIN 查询 通常 快 一 些 。 





SELECT Customer .LastName， Customezr .FILIrStName， Saleitem.ItemID 
FROM (Customez 
INNER JOIN Sale ON Customer .CustomerID = Sale.CustomerID) 
INNER JOIN SaleTtem ON Sale.SaleID = SaleItem.SaleID 


WHERE (SaleItem.ItemID In 
(SELECT ItemID FROM Merchandise WHERE Category= Cat ' ) 
) ， 





图 5-4 在 子 查 询 中 使 用 IN。 列 出 所 有 购买 和 猫 相关 商品 的 顾客 。 子 查询 生成 和 
猫 相关 商品 的 ItemID 列 表 。 如 果 ItemID 出 现在 那个 子 查询 列表 中 ， 主 查 
询 匹配 


5.4.3 带 有 ANY 和 ALL 的 子 查 询 


ANY 和 ALL 运 算 符 用 于 比较 数字 和 子 集 合 。 在 前 一 小 节 讲 过 的 IN 运算 符 用 于 比较 值 和 集 
合 项 的 列表 ， 但 IN 用 于 等 值 比较 。 测 试 项 必须 和 列表 中 的 一 项 精确 匹配 。ANY、ALL 运 算 符 
可 以 和 小 于 (<) 或 大 于 (>) 运算 符 一 同 使 用 ， 并 且 把 测试 值 和 一 系列 值 进行 比较 。 

图 $-5 举 例 说 明 带 有 ANY 的 查询 语句 。 很 难 找到 必须 使 用 ANY 运 算 符 的 查询 例子 。 在 这 个 
例子 中 ， 如 果 首 先 找到 列表 中 的 最 小 值 ， 然 后 作 比 较 也 同样 简单 。 但 是 ， 有 的 时 候 使 用 ANY 
运算 符 更 加 清晰 。SOME 可 以 代替 ANY ， 它 们 的 功能 相同 。 

ALL 运 算 符 和 ANY 相 似 ， 但 是 测试 值 必 须 大 于 列表 中 的 所 有 值 。 换 名 话说， 测试 值 必 须 
大 于 列表 中 的 最 大 值 。 因 此 ，ALL 运 算 符 更 加 严格 。ALL 运 算 符 是 一 个 强 有 力 的 工具 一 一 尤其 
和 等 值 比较 (=) 一 起 使 用 时 。 例 如 ， 如 果 想 测试 一 个 售货员 的 所 有 销售 是 否 都 在 一 天 完成 ， 
WHERE 子 句 可 能 会 包含 如 下 语句 ，WHERE EmployeelD = ALL (SELECT EmployeeID FROM 
Sale WHERE SaleDate = Date())。 
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SELECT Animal.AnimalIiD, Name, SalePrice, ListPrice 
FROM Animal 

INNER JOIN SaleMnimal ON Animal.AnimalID = 
SaleAnimal .AnimalID 

WHERE ({SalePrice > Any 


(SELECT 0.80*ListPrice 

FROM Animal 

INNER JOIN SaleAnimal ON Animal.AnimalID = 
SaleAnimal .AnimalID 

WHERE Category = ‘Cat’)) 





AND (Category='‘Cat'’); 


图 5-5 带 有 ANY 和 ALL 的 子 查 询 。 这 个 例子 计算 卖 出 猫 标价 的 80%。 然 后 找到 
售 价 高 于 那个 水 平 的 所 有 动物 。 换 名 话 说 ， 列 出 了 售 价 接近 猫 的 标价 的 
动物 


5.5 差 ， NOT IN 
在 业务 设置 中 ， 经 常 遇 到 这 样 的 问题 ， 如 图 5-6 所 示 : 哪些 动物 没有 卖 出 ?这 个 问题 具有 
欺骗 性 。 乍 看 起 来 ， 只 需 连 接 Animal 表 和 SaleAnimal 表 。 然 后 呢 ? 标准 的 JOIN 语句 只 显示 那 


些 同时 出 现在 Animal 表 和 SaleAnimal 表 的 动物 。 只 要 输入 了 JOIN 语句 ， 输 出 列表 自动 限制 为 
只 有 卖 出 的 动物 。 解 决 这 个 问题 的 一 个 办 法 是 改变 JOIN 命令 的 动作 ， 下 节 将 论述 这 个 问题 。 





- 
SELECT Animal.AnimaliD, Animal.Name, Animal.Category | 
FROM Animal | 
WHERE [Animal.AnimailD Net bn | 

(SELECT AnimalD From SateAnimai)); | 















Name | Category 


Animal | Animal 


Animall0 Kame . Category 
12 Lelsha Dog 
19 Gene Dog 











25 Vivian Dog 
34 Rhonda Dog 
88 Brandy Dog 
181 Fish 





























图 5-6 使 用 NOT IN 的 子 查询 。 哪 些 动物 没有 卖 出 ? 先 列 出 所 有 的 动物 ， 然 后 
减 去 卖 出 的 


另 一 个 有 效 的 办 法 是 从 数据 集合 的 角度 考虑 如 何 解 决 问题 。 考 虑 列表 写 在 纸 上 该 怎么 办 : 
一 个 列 出 商店 购买 的 所 有 动物 ， 另 一 个 列 出 所 有 已 经 卖 出 的 动物 。 如 图 5-7 所 示 ， 为 了 回答 这 
个 问题 ,遍历 主 Animal 表 ， 从 中 划 去 已 经 卖 出 的 动物 (出 现在 SaleAnimal 中 )。Animal 表 中 剩 
下 的 就 是 没有 卖 出 的 动物 。 

SQL 子 查询 的 工作 原理 与 此 类 似 。 第 一 步 列 出 所 有 的 动物 一 一 如 图 5-6 中 查询 主体 所 示 。 
但 是 只 有 不 在 SaleAnimal 表 中 出 现 的 动物 才能 列 出 ( 子 查询 )。 

SQL NOT IN 命令 是 一 个 有 用 的 工具 。 对 于 涉及 多 个 限制 条 件 的 复杂 查询 更 是 如 此 。 通 过 








把 相关 的 限制 条 件 放 在 子 查询 中 ， 主 查询 变 得 简单 易 懂 。 


Animal SaleAnimal 


iD SaleiD SaiePrice 

2 $10.80 
80 $156.66 
$173.99 
25 $251.59 
4 $183.38 
10 18 $150.11 
1 17 $148.47 





Ce ~ GD 和 
mm 
-a 








图 5-7 差 子 查询 数据 示例 。NOT IN 语 句 移 除 已 经 卖 出 的 动物 ， 留 下 没有 卖 出 的 


5.6 外 连接 


截至 目前 ， 当 涉及 多 个 表 时 ， 例 子 和 讨论 都 集中 在 INNER JOIN (或 等 值 连接 )。 这 种 类 
型 的 连接 是 最 常见 的 ， 经 常 在 查询 中 使 用 。 但 是 ， 它 也 有 局 限 性 ， 需 要 使 用 另 一 种 JOIN， 即 
外 连接 (OUTER JOIN)。 

为 了 举例 说 明 OUTER JOIN， 考 虑 前 一 节 的 问题 ， 哪 些 动 物 没 有 卖 出 ?如 果 使 用 INNER 
JOIN 连接 Animal 和 SaleAnimal 表 ， 结 果 仅 仅 列 出 两 张 表 中 都 有 的 动物 。INNER JOIN 命令 指示 
DBMS 把 Sale Animal 表 的 每 一 项 和 Animal 表 相应 的 AnimalID 相 匹配 。 如 果 因 为 某 种 原因 不 能 
匹配 ， 问 题 中 的 数据 无 法 显示 。 

OUTER JOIN 改变 了 两 张 表 的 数据 匹配 方式 。 特 别 地 ，OUTER JOIN 描述 当 一 张 表 中 的 值 
在 另 一 张 表 中 不 出 现时 该 如 何 处 理 。 

连接 两 张 表 时 ， 必 须 考虑 两 种 基本 情况 ，(1) 左 侧 表 中 的 值 在 右 侧 表 没 有 匹配 项 ，(2) 
右 侧 表 中 的 值 在 左 侧 表 没有 匹配 项 。 当 然 ， 哪 个 在 左 侧 哪 个 在 右 侧 没 有 实质 性 区 别 。 但 是 ， 
列 出 表 之 后 必须 小 心 ， 不 能 混 诺 。 在 QBE 中 ， 表 自然 地 按照 出 现 的 顺序 显示 。 在 SQL 中 ,， 左 侧 
的 表 先 列 出 。 

图 5-8 的 查询 是 一 个 典型 的 左 OUTER JOIN (或 简写 为 LEFT JOIN) 。 在 LEFT JOIN 中 , 左 
侧 表 的 所 有 行 都 会 在 结果 中 显示 。 如 果 右 侧 表 没有 匹配 值 ， 输 出 中 将 填 人 NULL 值 。 注 意 
LEFT JOIN 如 何 解 决 识别 没有 卖 出 动物 的 问题 。 因 为 查询 会 列 出 所 有 的 动物 ，SaleID 为 NULL 
的 行 表明 该 动物 在 Sale 表 中 不 存在 ， 即 没有 卖 出 。 该 查询 的 输出 结果 如 图 3-9 所 示 。 

RIGHT JOIN 和 LEFT JOIN 类 似 。 惟 一 的 区 别 是 表 的 顺序 。 如 果 需 要 右 侧 表 的 全 部 行 ， 就 
可 以 使 用 RIGHT JOIN。 为 什么 不 把 LEFT JOIN 中 表 的 顺序 调整 一 下 呢 ? 大 部 分 情况 下 ， 可 以 
这 人 么 做 。 但 是 ， 如 果 把 几 张 表 连接 起 来 ， 有 时 使 用 RIGHT JOIN 可 以 避免 重新 对 表 排 序 ， 这 样 
会 简单 一 些 。 

另外 一 个 连接 是 全 外 连接 (full OUTER JOIN 或 FULL JOIN) ， 把 左 侧 表 的 每 一 行 和 右 便 
表 的 每 一 行 组 合 起 来 。 如 果 行 不 匹配 (根据 ON 条 件 )， 则 连接 在 适当 的 列 插入 NULL 值 。 

警告 ， 使 用 外 连接 必须 小 心 一 一 尤其 是 全 外 连接 。 两 张 没 有 太 多 公共 数据 的 规模 比较 大 的 
表 的 连接 结果 十 分 巨大 且 没 有 意义 。 在 一 个 查询 中 对 两 张 以 上 表 进 行 QOUTER JOIN 操作 也 要 小 
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心 。 结 果 依 赖 于 表 连 接 的 顺序 。 


SELECTAnimal.AnimallD, Animal.Name, Animal.Category 
FROM Animal LEFT JOIN SaleAnimal 

ON Animal.AnimallD = SaleAnimal.AnimallD 

WHERE (SaleAnimal.SalelD Is Null); 







AnimallD S$alelD 
AnimallD 
SalePrice 


Cate 

EEC 

a 
| 
| 





图 5-8 左 外 连接 。 哪 些 动物 没有 卖 出 ? 左 外 连接 包括 Animal 表 ( 左 侧 ) 的 所 有 
行 ， 以 及 SaleAnimal 表 的 所 有 匹配 行 。 如 果 动 物 没有 卖 出 ， 那 么 在 


SaleAnimal 表 中 没有 该 项 ， 所 以 相应 的 项 为 NULL 


Angel 
Dalmation 


Ee 


Oriental Shorthair 
Bombay 
Norfolk Terrier 


Siberian Huskie 
Dalmation 


==E 
_、 全 "i 





图 5-9 左 外 连接 的 结果 。 注 意 缺 失 值 (Null) 即 动物 没有 卖 出 
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最 后 ， 注 意 这 些 都 以 SQL92 为 基础 ， 优 点 是 通俗 易 懂 。 但 是 有 的 数据 库 系 统 不 支持 这 种 语 
法 。 一 种 常见 的 古老 的 实现 OUTER JOIN 的 技术 是 使 用 由 星 号 和 等 号 构成 的 连接 ， 例如 ，(*=) 
表示 左 外 连接 ， 因 为 星 号 位 于 等 号 的 左 侧 。SQL Server 上 关于 动物 的 查询 如 图 5-10 所 示 。 虽 然 
这 个 语法 和 SQL92 不 同 ， 但 作用 相同 。 当 阅读 老 系统 开发 的 查询 时 注意 这 种 写法 ， 星 号 (*) 


容易 被 忽略 ， 但 是 它 确实 改变 了 查询 结果 。 


旧版 Oracle 的 查询 语句 使 用 另外 的 语法 规则 表达 外 连接 。 图 5-10 中 的 WHERE 语 句 变 为 
Animal.AnimalID = (+) SaleAnimal.AnimalID 。 带 括号 的 加 号 表示 OUTER JOIN, 但 是 注意 。 


加 号 位 于 等 号 的 右 侧 。 换 名 话说， 如 果 需 要 左 外 连接 ， 必 须 把 加 号 放 在 等 号 的 右 侧 。 这 可 能 


和 想象 的 不 同 ， 正 好 和 星 号 标记 相反 。 








SELECT ALL 
FROM Animal, SaleAnimal 


WHERE Animal.AnimalID *= SaleAnimal .AnimalID 
And SaleAnimal.SaleIiD Is Null 





图 5-10 旧版 LEFT JOIN 语 法 。 哪 些 动物 还 没有 卖 出 ?注意 星 号 -等 号 运算 符 
(*=) 表示 LEFT JOIN。 相 反 地 (=*) 表示 RIGHT JOIN 


5.7 关联 子 查询 存在 危险 


回顾 图 5-2 的 例子 ， 哪 些 猫 的 售 价 高 于 猫 的 平均 价格 ?这 个 例子 首先 使 用 子 查 询 找 到 猫 的 
平均 售 价 ， 然 后 检查 所 有 猫 的 售 价 ， 如 果 高 于 平均 价格 就 显示 。 有 理由 把 这 个 查询 扩展 到 关 
于 其 他 动物 的 查询 问题 。 管 理 者 可 能 想 找到 所 有 售 价 高 于 该 动物 所 在 种 类 的 平均 售 价 的 动物 
(例如 高 于 狗 的 平均 价格 的 狗 ， 鱼 和 鱼 相 比 ， 等 等 )。 

虽然 这 样 的 业务 问题 十 分 必要 ， 但 是 作为 查询 语句 可 能 带 来 一 系列 严重 的 问题 。 开 始 ， 如 
何 构造 查询 并 不 明显 。 一 种 方案 是 采用 图 5-2 的 查询 ， 并 且 在 主 查 询 和 子 查询 中 都 用 “Dog” 
代替 “Cat ， 这 种 方案 虽然 可 行 ， 但 必须 找到 所 有 的 种 类 ， 对 于 每 一 个 种 类 编辑 查询 。 

为 了 避免 手工 输入 每 个 种 类 ， 子 查询 可 以 从 主 查询 中 得 到 种 类 ， 然 后 计算 该 种 类 的 平均 售 
价 。 图 5-11 是 创建 这 样 查询 的 第 一 个 尝试 。 难 点 在 于 主 查询 使 用 了 Animal 表 ， 子 查询 也 使 用 
Animal 表 。 因 此 ，WHERE 限 制 不 起 作用 。 需 要 指定 一 张 Animal 表 只 用 于 主 查询 ， 另 一 张 只 用 
于 子 查询 。 为 了 做 到 这 一 点 ， 需 要 使 用 对 表 重 命名 〈 别 名 ) ， 如 图 5-12 所 示 。 


SELECT AnimalID, Name, Category, SalePrice 
FROM Animal INNER JOIN Saleanimal ON 
animal.animalID = SaleAnimal .AnimalTD 
WHERE {SaleAnimal .SalePrice> 

(SELECT Avg (SaleAnimal .SalePrice) 


FROM Animal INNER JOIN SaleAnimal ON 

Animal.AnimalID = SaleAnimal .AnimalID 

WHERE (Mnimal.Category = Animal.Category)) ) 
ORDER BY SaleAnimal.SalePrice DESC; 





图 5-11 创建 关联 子 查 询 。 列 出 售 价 高 于 该 种 动物 平均 价格 的 动物 。 子 查询 需 
要 计算 主 查询 中 出 现 的 动物 种 类 的 平均 售 价 。 但 是 两 张 表 都 叫做 
“Animal”， 这 个 查询 无 法 进行 





SELECT Al.AnimalID, Al.Name, Al.Category, 
SaleAnimal .SalePrice 
FROM Animal AS Al INNER JOIN SaleAnimal ON 
Al.AnimalID = SaleMimal .AnimalID 
WHERE (SaleAnimal.SalePrice> 
(SELECT Avg (SaleAnimal .SalePrice) 
FROM Animal As A2 INNER JOIN SaleAnimal ON 
A2.AMnimalID = SaleAnimal .AnimalID 
WHERE (A2.Category = Al.Category)) ) 
ORDER BY SaleMnimal .SalePrice DESC; 











图 5-12 可 以 运行 的 关联 子 查询 。 注 意 使 用 重 命名 区 别 两 张 表 。 但 是 永远 不 要 
使 用 这 种 方法 ， 因 为 效率 极 低 





图 5-12 的 查询 虽然 可 以 运行 ， 但 是 效率 十 分 低 。 即 使 在 一 个 比较 快 的 计算 机 上 ， 这 种 查询 
运行 几 天 也 得 不 到 结果 ! 这 种 查询 叫做 关联 子 查询 ， 因 为 子 查询 引用 了 主 查询 的 数据 行 。 对 
于 主 查询 中 的 每 一 条 记录 ， 子 查询 必须 重复 计算 。 图 5-13 列 出 这 个 问题 。 本 质 上 ，DBMS 从 主 
查询 Animal 表 的 最 上 一 行 开始 。 它 发 现 种 类 是 Fish, 计 算 色 的 平均 价格 (37.78 美 元 ) 。 然 后 移 向 
下 一 行 ， 计 算 狗 的 平均 价格 。 当 DBMS 到 达 第 三 行 ， 再 次 磁 上 Fish， 必 须 重 新 计算 鱼 的 平均 价 
格 〈 还 是 37.78 美 元 ) ， 对 于 主 查询 每 一 行 都 要 重新 计算 动物 的 平均 价格 十 分 耗 时 。 为 了 计算 平 
均值 ，DBMS 必 须 遍 历 表 中 相同 种 类 动物 的 每 一 行 。 考 虑 一 个 相对 小 的 查询 有 100 000 行 和 5 种 
动物 。 平 均 起 来 ， 2 000 行 。 每 次 重新 计算 和 均值 ， DBMS 必 须 检索 100 000*20 000 
或 者 2 000 000 000 行 


Animal + SaleAnimal 
Category SalePrice 


Compute Avg: $37.78 
Compute Avg: $174.20 
Compute Avg: $37.78 
Compute Avg: $169.73 
Compute Avg: $169.73 


Recompute average 
for every row in the 
main query! 


图 5-13 关联 子 查询 的 问题 。 对 于 主 查询 每 一 行 都 要 重新 计算 平均 价格 。 
DBMS 每 次 遇 到 鱼 ， 计 算 平均 价格 为 37.78 美 元 。 这 种 做 法 毫 无 效率 
(并 且 十 分 缓慢 )， 它 强制 机 器 每 次 重复 计算 平均 价格 
不 幸 的 是 ， 不 能 简单 地 告诉 管理 者 这 个 重要 的 业务 问题 无 法 回答 。 存 在 有 效 的 解决 方式 
吗 ? 问题 的 解答 说 明 SQL 的 能 力 以 及 写 查询 语句 之 前 思考 问题 的 重要 性 。 关 联 子 查询 的 问题 在 
于 它 不 停 地 重复 计算 每 一 种 的 平均 值 。 考 虑 手工 计算 时 如 何 解决 这 一 问题 。 首 先 做 一 张 表 ， 
把 每 种 动物 的 平均 值 列 出 ， 然 后 当 需 要 的 时 候 查 找 相关 项 。 如 图 5$-14 所 示 ， 同 样 的 方法 可 以 通 
过 SQL 实现 。 用 GROUP BY 创建 查询 计算 平均 值 ， 保 存 结果 。 然 后 连接 Animal 和 SaleAnimal 表 
作 比 较 。 虽 然 在 这 个 小 例子 中 该 方法 需要 遍历 两 次 查询 行 ， 或 者 读 入 200 000 行 ， 它 比 相 关子 
查询 效率 高 10 000 倍 ! 如 果 运 行 新 查询 需要 1 分 钟 ， 那 么 关联 子 查 询 需 要 7 天 才能 完成 ! 
Animal + SaleAnimal 
Category SatePrice Saved Query 
CategoryAvg0fSaileprice 










Animal.Category = 
Query1.Category 





图 5-14 更 有 效 的 解决 方案 。 用 GROUP BY Category 创 建 和 存储 查询 计算 平均 
值 。 然 后 连接 查询 与 Animal 和 SaleAnimal 表 进行 比较 
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5.8 SQL SELECT 的 更 多 特征 和 技巧 


正如 读者 可 能 已 经 注意 到 的 SQL SELECT 命 令 功 能 强大 ， 并 且 有 很 多 选项 。 还 有 更 多 的 特 
征 和 技巧 需要 知道 。 业 务 问题 可 能 很 难 回答 。 研 究 多 种 多 样 的 案例 ， 对 问题 和 解决 方案 可 以 


开阔 思路 。 
5.8.1 UNION、INTERSECT 和 EXCEPT 


到 目前 为 止 ， 用 到 的 表 包 括 单独 的 数据 列 。JOIN 命 令 把 表 连 起 来 ， 使 得 查询 可 以 显示 和 
比较 来 自 多 个 表 的 不 同 列 。 偶 尔 可 能 遇 到 另 一 类 问题 ， 即 合并 相似 表 的 数据 行 。UNION 运 算 


符 就 是 做 这 件 事 的 。 


作为 一 个 例子 ， 假 设 你 在 一 家 公司 工作 ， 这 家 公司 在 洛杉矶 和 纽约 有 办 公 室 。 每 个 办 公 室 
维护 自己 的 数据 库 。 每 个 办 公 室 有 包括 雇员 标 


准 信息 的 Employee 文 件 。 办 公 室 用 网 络 连接 ， | BRU Em Oowespest "Salo ast A DWIe 
UNION 


所 以 可 以 访问 两 张 表 (叫做 EmployeeEast 和 


SELECT EID, Name, Phone, Salary "West AS Offi 
EmployeeWest)。 但 是 公司 的 管理 者 经 常 搜索 整 ”| FROM Em seat one, salary ce 


个 Employee 文 件 一 一 例如， 为 了 决定 市 场 部 门 
的 所 有 雇员 工资 。 一 个 解决 方案 是 运行 两 次 基 
本 查询 (每 次 一 张 表 ) 然后 手工 连接 查询 结果 。 
如 图 5-15 所 示 ， 更 简单 的 解决 方案 是 使 用 
UNION 运 算 符 创建 新 的 查询 把 两 张 表 的 数据 合 
并 起 来 。 所 有 在 这 个 新 的 查询 上 进行 的 搜索 和 
操作 把 两 张 表 看 作 一 张大 表 。 通过 视图 合并 表 ， 
每 个 办 公 室 可 以 在 自己 的 系统 中 修改 原始 数据 。 
当 管理 者 需要 搜索 整个 公司 时 ， 使 用 保存 的 查 
询 ， 可 以 自动 检查 来 自 两 张 表 的 当前 数据 。 





图 5-15 UNION 运算 符 把 两 个 SELECT 语句 得 到 的 


数据 合并 在 一 起 。 两 个 SELECT 行 中 的 列 
必须 匹配 。 查 询 通常 保存 起 来 ， 当 管理 者 
需要 搜索 两 张 表 的 时 候 使 用 。 注 意 使 用 一 
个 新 的 常量 列 (Office) 来 表示 数据 来 源 


创建 UNION 最 重要 的 是 要 记 住 来 自 两 张 表 的 数据 必须 匹配 〈 例 如 : EID 和 EID，Name 和 


Name) 。 另 一 个 技巧 是 在 SELECT 语句 中 播 入 常量 
值 。 在 本 例 中 , 这 个 值 表明 原始 数据 来 自 于 哪 张 表 。 
如 果 一 个 查询 产生 的 列 在 另 一 个 查询 中 没有 而 产生 
问题 ， 这 个 常量 值 可 以 消除 这 类 问题 。 为 了 保证 两 
个 查询 返回 相同 数目 的 列 ， 在 不 包含 目标 列 的 查询 
中 插入 常量 值 。 确 保 一 个 查询 中 的 数据 类 型 和 另 一 
个 的 相同 ( 域 必须 匹配 )。 

UNION 命 令 合 并 两 张 表 中 匹配 的 数据 行 。 默 
认 的 命令 自动 消除 重复 的 数据 行 。 如 果 希 望 保留 
所 有 的 行 一 -即使 重复 ， 使 用 UNION ALL 命 令 。 
另外 两 个 合并 行 的 选择 是 EXCEPT 和 INTERSECT。 
图 5-16 表 示 这 三 个 命令 的 区 别 。 它 们 都 对 数据 行 操 
作 ， 维 恩 图 (Venn diagran) 表示 两 张 表 可 能 有 共 





[TuoNT™2 | ArBrc | 
ITINTERSECTT2 | B | 


图 5-16 合并 两 张 表 中 行 的 运算 符 。UNION 
选择 所 有 的 行 。INTERSECT 返 回 两 
张 表 的 公共 行 。EXCEPT 返 回 只 出 现 
在 一 张 表 中 的 行 
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同 数据 (区 域 B) 。UNION 运 算 符 返 回 在 任何 一 张 表 中 出 现 的 数据 ， 但 是 两 张 表 的 共同 行 只 返 
回 一 次 。INTERSECT 运 算 符 返回 两 张 表 都 出 现 的 行 《区域 B) 。EXCEPT 运 算 符 返回 只 出 现在 
第 一 张 表 的 行 (区域 A)。 注 意 EXCEPT 的 结果 取决 于 哪 张 表 写 在 前 面 。 


5.8.2 多 JOIN 列 


有 时 需要 根据 多 个 列 的 数据 连接 表 。 在 宠物 商店 的 例子 中 ， 每 一 个 动物 属于 某 个 类 (Cat、 
Dog、Fish 等 )。 每 个 类 的 动物 又 有 不 同 的 品种 。 例 如 ，Cat 可 能 是 Manx、Maine Coon ， 或 者 
Persian; Dog 可 能 是 Retriever、Labrador、 或 者 St. 
Bernard。 类 图 的 一 部 分 在 图 5-17 中 重新 描绘 。 注 意 
两 条 线 连接 Breed 和 Animal 表 。 这 个 关系 保证 了 只 有 
列 在 Breed 表 的 种 类 才能 赋 给 Animal 的 类 型 。 一 个 实 
际 的 商店 可 能 包括 一 个 在 Breed 表 中 描述 附加 的 特征 
(例如 注册 机 构 、 种 类 描述 或 者 种 类 性 质 )。 关 和 键 在 
于 表 必 须 通 过 Category 和 Breed 连 接 。 








在 Microsoft Access QBE 中 , JOIN 的 构造 方法 为 ; SELECT * | 
标记 两 列 ， 同 时 把 它们 拖 搜 到 Animal 表 。SQL JOIN rr 
命令 语法 在 图 5-17 中 给 出 。 只 要 在 ON 语句 中 列 出 两 eo me red 
列 连接 就 可 以 了 。 这 种 情况 下 ， 两 个 列 的 集合 同时 
相等 ， 因 此 语句 由 AND 连 接 。 图 5-17 多 JOIN 列 。 只 有 种 类 和 品种 都 匹 

配 的 时 候 ， 两 张 表 的 数据 才能 连接 
5.8.3 自 反 连 接 


自 反 连接 或 自 连接 的 意思 是 表 自 身 的 连接 。 表 中 一 列 和 同一 张 表 的 另 一 列 的 值 匹配 。 关 于 
BEmployee 表 的 常见 业务 问题 如 图 5-18 所 示 。 和 雇员 有 其 管理 者 。 因 此 管理 者 的 ID 在 每 一 个 雇员 
行 中 存储 。 表 为 Employee(EID, Name, Phone, …, Manager)。 有 趣 的 特征 是 管理 者 也 是 一 个 雇 
员 ， 所 以 Manager 列 实际 包括 EID 的 值 。 为 了 找到 管理 者 相应 的 名 字 ， 需 要 把 Employee 表 与 其 
自身 连接 。 


Employeese 
SELECT Employeese.Ei0， 


| Employee.Name, 
Employee.Manager, E2.Name 


FROM Employees INNER JOIN 
Employee AS E2 





Name 
115 Sanchez 765 Munoz 
462 拓 iHer 115 Sanchez 
523 ”Hawk 115 Sanchez 


ON Employee.Manager = E2.EID 


图 5-18 Employee 表 连接 自身 的 自 反 连接 。 管 理 者 也 是 雇员 。 使 用 Employee 表 
的 第 2 副本 ( 重 命 名 为 E2) 获得 管理 者 的 名 字 





操作 中 惟一 需要 注意 的 是 ON 条 件 。 例 如 ， 下 面 的 条 件 没 有 意义 : ON Employee.Manager = 
Empoloyee.EID 。 这 个 查询 返回 管理 者 是 自己 的 雇员 ， 并 不 是 想 要 的 。 相 反 ， 必 须 使 用 两 个 
Empoloyee 表 的 实例 ， 并 且 对 第 二 副本 重 命名 (假定 为 E2)。 正 确 的 ON 条 件 是 ON 
Employee.Manager = E2.EID。 自 连接 的 关键 是 列 包 含 相同 类 型 的 数据 ， 并 且 为 第 二 副本 重 命名 。 

SQL1999 中 自 连 接 的 功能 更 为 强大 。 考 虑 雇员 的 例子 ， 列 出 所 有 为 某 人 服务 的 员工 一 一 不 
仅 包括 直接 的 下 属 ， 还 有 为 他 们 服务 的 人 ， 为 该 小 组 工作 的 人 ， 沿 着 雇员 层次 树 逐 步 向 下 搜 
索 。 系 统 提供 了 WITH RECURSIVE 命 令 ， 它 有 几 个 搜索 数据 树 的 选项 。 考 虑 一 般 的 情况 ， 有 
一 张 表 : Manages(ManagerID, EmployeelD, Title, Salary)。 可 以 从 CEO 开 始 列 出 所 有 的 雇员 ， 


WITH RECURSIVE FEmployeeList (EmployeeID，Title，Salary) AS 
(SELECT EmployeeID, Title, 0.00 

FROM Manages WHERE Title = “CEO” --starting level 
UNION ALL 

SELECT Manages.EmployeeID, Manages.Title, Manages.Salary 
FROM EmployeeList INNER JOIN Manages 

ON EmployeeList.EmployeeID = Manages .ManagerID) 

SELECT EmployeeID, Count (Title), Sum(Salary) 

FROM EmployeeList 

GROUP BY EmployeeEID:; 


惟一 的 缺点 是 现在 的 DBMS 版 本 不 再 支持 WITH RECURSIVE 语 句 。 没 有 这 样 功 能 强大 的 
语句 ， 就 需要 自己 编写 代码 来 完成 同样 的 工作 。 


5.8.4 _ CASE 函数 





SQL92 增 加 CASE 国 数 简化 部 分 类 的 查询 。 但 是 ， 很 多 数据 库 系 统 没 有 实现 SQL92 的 所 有 
特征 。 因 此 ，Microsoft Access 97 不 支持 ，Microsoft SQL Server6.5 版 也 不 提供 这 个 函数 。 

也 许 管理 者 想 根据 年 龄 对 Sally 的 宠物 商店 中 的 动物 分 类 。 图 5-19 的 SQL 语句 根据 不 同 的 年 
龄 创建 了 四 种 类 。 注 意 日 期 计算 的 方法 ， 用 到 了 今天 的 日 期 (Date0) 和 DataBorn。 不 论 何 时 
执行 该 查询 ， 都 使 用 当时 的 日 期 ， 把 动物 分 到 合适 的 种 类 。 当 然 ， 下 一 步 是 针对 这 个 视图 运 
行 GROUP BY 查询 ， 对 每 个 年 龄 段 的 动物 计数 。 


Select AnimalID， 
CASE 
WHEN Date()-DateBorn <90 Then “Baby” 
WHEN Date()-DateBorn ~>= 90 
Date()-DateBorn <270 Then “Young” 


WHEN Date()-DateBorn >=270 
Date()-DateBorn <365 Then “Grown’” 
"Experienced” 


FROM Animal; 





图 5-19 CASE 函 数 把 DateBorn 转 换 为 年 龄 段 。 注 意 日 期 的 计算 方法 ， 生 成 总 是 
正确 的 当前 值 
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5.8.5 不 等 连接 


JOIN 语句 实际 上 是 一 个 条 件 。 大 部 分 问题 直接 使 用 简单 的 等 值 条 件 即 可 。 例 如 ， 下 面 的 
语句 把 Customer 和 Order 表 连接 起 来 ， FROM Customer INNER JOIN Order ON 
(Customer.CustomerID = OrderCustomerID)。 

SQL 支持 复杂 的 条 件 ， 包 括 不 等 连接 ， 比 较 运算 不 使 用 等 号 ， 而 是 不 等 号 (小 于 、 大 于 )。 
不 等 和 等 值 连接 共同 构成 9 连接 。 

这 种 类 型 的 连接 在 某 些 条 件 下 是 有 用 的 。 例 如 ， 考 虑 一 个 常见 的 业务 问题 。 有 一 张 表 
AccountsReceivable (TransactionID, CustomerID, Amount, DateDue)。 管 理 者 希望 对 顾客 账户 分 
类 ， 按 照 30、90 和 120 或 更 长 时 间 确 定 过 期 事务 的 数量 。 构 造 这 个 查询 有 几 种 方案 。 例 如 ， 可 
以 写 三 个 独立 的 查询 。 但 是 ， 如 果 管 理 者 决定 改变 业务 规则 或 者 建立 一 个 新 的 分 类 怎么 办 ? 
必须 有 人 找到 并 且 修 改 这 三 个 查询 语句 。 一 个 更 有 用 的 技巧 是 创建 一 个 新 的 表 记 录 业 务 规则 
和 分 类 方案 。 如 图 5-20 所 示 ， 创 建新 表 LateCategory (Category, MinDays, MaxDays, Charge 等 )。 
这 张 表 根 据 过 期 时 间 定义 分 类 。 现 在 使 用 不 等 条 件 连 接 两 张 表 。 首 先 ， 使 用 当前 日 期 计算 过 
期 天 数 (DateO - AR.DateDue)。 最 后 ， 把 过 期 天 数 和 LateCategory 表 中 的 最 大 最 小 值 比较 。 


AR(TransactionID, CustomerlD, Amount, DateDue) 
LateCategory(Category, MinDays, MaxDays, Charge, .. .) 
Month 
Quarter 
Overdue 


SELECT * 

FROM AR INNER JOIN LateCategory 

ON ((Date() - AR.DateDue) >= Category.MinDays) 
AND ((Date() - AR.DateDue) < Category .MaxDays) 





图 5-20 不 等 连接 。 管 理 者 想 把 表 AccountsReceivable (AR) 数据 分 成 三 类 延 
期 付款 。 首 先 ， 把 业务 规则 /分 类 存储 在 一 张 新 表 中 。 把 这 张 表 和 AR 数 
据 通过 不 等 号 连接 起 来 
这 种 做 法 的 本 质 在 于 业务 规则 存储 在 一 个 简单 的 表 (LateGategory) 中 。 如 果 管 理 者 想 修 
改 条 件 或 增加 新 的 条 件 ， 只 需要 修改 表 中 的 数据 。 甚 至 可 以 创建 表单 使 管理 者 更 容易 看 到 规 
则 ， 并 迅速 做 出 需要 的 修改 。 如 果 使 用 其 他 方式 ， 程 序 员 必须 重 写 查询 代码 。 


5.8.6 带 有 “每 一 个 ”的 查询 需要 EXISTS 子 名 


有 的 查询 需要 EXISTS 条 件 。 考 虑 这 个 问题 : 哪些 雇员 每 一 种 动物 都 卖 过 ? 这 里 的 关键 在 
于 每 一 种 。 如 果 没 有 计算 机 该 如 何 回答 这 个 问题 ? 对 于 每 个 雇员 ， 列 出 动物 的 种 类 (Bird， 
Cat，Dog 等 )。 然 后 浏览 AnimalSales 表 ， 划 掉 该 雇员 卖 出 的 每 种 动物 。 完 成 之 后 ,观察 雇员 表 ， 
哪些 雇员 的 每 种 动物 都 划 去 了 (或 一 张 空 表 ) 。 使 用 查询 语句 做 同样 的 事情 。 

首先 ， 需 要 使 用 查询 列 出 某 雇 员 还 没有 卖 出 的 动物 的 种 类 。 考 虑 EmployeeID 为 5 的 雇员 ， 
如 图 5-21 的 查询 。 注 意 使 用 基本 的 NOT IN 查询 。 还 可 以 使 用 OUTER JOIN, 但 是 对 于 3 张 表 ， 
使 用 NOT IN 更 容易 。 








SELECT Category 
FROM Category 
WHERE (人 (Category <> "Other”) And Category NOT IN 
(SELECT Animal .Category 


FROM Animal INNER JOIN (Sale INNER JOIN SaleAnimal 
ON Sale.SalelID = Saleanimal.SaleID) 
ON Animal.AnimalID = SaleAnimal .AnimalID 

WHERE Sale.EmployeeID = 5) 





图 5-21 列 出 EmployeeID5 的 雇员 没有 卖 出 的 动物 种 类 。 使 用 基本 的 NOT IN 查询 


记 住 ， 如 果 这 个 查询 返回 结果 ， 那 么 该 雇员 设 有 卖 出 每 一 种 动物 。 想 要 的 是 那些 用 这 个 查 
询 不 返回 数据 的 雇员 。 换 名 话说， 这 个 查询 的 结果 应 该 不 存在 (NOT EXIST) ! 

下 一 步 检查 整个 雇员 表 ， 看 哪些 雇员 在 图 5-22 的 查询 中 没有 返回 值 。 最 终 的 查询 如 图 5-24 
所 示 。 注 意 指定 的 EmployeeID 5 已 经 被 和 外 层 循环 相 匹 配 的 EmployeeID 替 换 。 这 个 查询 是 一 
个 关联 子 查询 。 不 幸 的 是 ， 对 于 这 种 问题 ， 无 法 避免 关联 子 查询 。 这 个 查询 返回 一 个 雇员 
(Reasoner) ， 他 每 种 动物 都 卖 出 过 。 


SELECT Employee.EmployeeID, Fmployee.LastName 
FROM Employee 
WHERE Not Exists 
(SELECT Category 
FROM Category 
WHERE (Category <> “Other”) And Category NOT IN 


(SELECT Animal.Category 
FROM Animal INNER JOIN (Sale INNER JOIN Saleanimal 
ON Sale.SaleID = SaleAnimal .SaleID) 
ON Animal.AMnimalID = SaleAnimal .AnimalID 
WHERE Sale.EmployeelID = Employee.EmployeeID) 
); 





图 5-22 NOT EXISTS 子 名 的 例子 。 列 出 卖 出 每 种 动物 的 雇员 “其 他 ”(Other) 
除外 ) 
图 5-22 所 示 的 查询 类 型 经 常用 来 回答 包括 “每 一 个 ”字样 的 查询 。 有 些 情 况 下 ， 一 个 简单 
的 方法 是 对 每 个 雇员 卖 出 的 动物 种 类 计数 。 这 种 方法 要 求 DBMS 必 须 支 持 Count (DISTINCT) 
格式 。 一 般 来 说 ， 这 些 复 杂 的 查询 使 用 多 个 查询 语句 会 更 好 ， 或 者 使 用 第 8 章 描述 的 数据 仓库 
方法 提供 的 工具 。 


5.8.7 SQL SELECT 小 结 


SQL SELECT 命令 功能 强大 ， 有 很 多 选项 。 为 了 帮助 读者 记 住 这 些 选 项 ， 图 5-23 列 出 了 
这 些 选 项 。 每 个 DBMS 的 SELECT 命令 有 一 个 类 似 的 列表 ， 最 好 参考 系统 的 相关 帮助 ， 看 看 实 
现 细节 是 否 有 所 不 同 。 记 住 WHERE 子 句 可 以 有 子 查询 。 

大 部 分 数据 库 系 统 对 SELECT 语句 的 组 成 部 分 的 顺序 要 求 非 常 严 格 。 例 如 ，WHERE 语 名 
应 该 在 GROUP BY 语句 之 前 。 有 时 这 些 错误 很 难 发 现 ， 所 以 当 遇 到 令 人 困惑 的 错误 信息 时 ， 
注意 检查 语句 顺序 的 正确 性 。 图 5-24 也 许 能 够 帮助 读者 记 住 正确 的 顺序 。 还 有 ， 一 定 要 逐步 建 
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立 查 询 ， 这 样 可 以 分 步 测试 。 例 如 ， 如 果 使 用 GROUP BY 语句 ， 首 先 检查 没有 它 时 选择 的 结 
果 是 否 正确 。 


SELECT DISTINCT Table.Column {AS Alias}, 
FROM Table/Query 

INNER JOIN Table/Query ON Tl1.ColA = T2.ColB 
WHERE (Condition) 


GROUP BY Column 

HAVING (Group Condition) 
ORDER BY Table.Column 
{UNION Second Select} 





图 5-23 SQL SELECT 选 项 。 记 住 WHERE 语 旬 可 以 有 子 查 询 


Someone SELECT 
FrYom FROM 
Ireland INNER JOIN 
Wiill WHERE 


Grow GROUP BY 
Horseradish and HAVING 
Onions ORDER BY 





图 5-24 记 住 SELECT 运 算 符 正确 顺序 的 方法 


5.9 SQL 数据 定义 命令 


截至 目前 ， 我 们 仅仅 关注 数据 库 的 一 个 方面 : 查询 数据 。 很 清楚 ， 数 据 库 还 有 很 多 其 他 的 
操作 。SQL 可 以 完成 所 有 的 常规 操作 。 本 节 主 要 讨论 数据 定义 命令 ， 即 如 何 创建 和 修改 数据 库 
及 数据 库 的 表 。SQL 命 令 实现 这 些 功能 比较 繁琐 。 因 此 ， 大 部 分 现代 数据 库 系统 提供 了 可 视 的 
或 菜单 的 方式 来 帮助 完成 这 些 工 作 。SQL 命 令 的 使 用 局 限于 需要 自动 完成 部 分 工作 ， 或 者 在 独 
立 的 程序 中 修改 数据 库 。 

五 个 最 常见 的 数据 定义 命令 如 图 5-25 所 示 。 当 创建 新 的 数据 库 时 ， 第 一 步 是 CREATE a 
SCHEMA 。 模 式 是 表 的 集合 。 在 有 的 系统 中 ， 这 个 命令 等 价 于 创建 一 个 新 的 数据 库 。 在 另 一 
些 系统 中 ， 它 仅仅 定义 每 个 用 户 可 以 存 表 的 逻辑 空间 ， 可 能 是 也 可 能 不 是 一 个 物理 的 数据 库 。 
授权 部 分 描述 用 户 并 设置 密码 保证 安全 。 

CREATE SCHEMA AUTHORIZATION DBName Password 


CREATE TABLE TableName (Colum Type, . . .) 
ALTER TABLE Table {Add, Column, Constraint, Drop} 


DROP {Table TableName | Index IndexName ON TableName]} 
CREATE INDEX IndexName ON TableName (Column ASC/DESC) 





图 5-25 主要 的 SQL 数据 定义 命令 。 大 部 分 情况 下 ， 可 视 的 或 菜单 命令 可 以 代 
替 它 们 来 定义 或 修改 表 


CREATE TABLE 是 主要 的 SQL 数据 定义 命令 之 一 。 用 于 定义 全 新 的 表 。 基 本 命令 列 出 表 


j%2 箱 二 部 分 查 功 








名 和 所 有 列 的 列 名 及 其 数据 类 型 。 数 据 定义 命令 的 格式 如 图 5-26 所 示 。 附 加 的 选项 包括 用 
DEFAULT 命 令 设置 默认 值 。 


CREATE TABLE Customer 
( CustomerID INTEGER NOT NULL, 
LastName VARCHAR (10), 


)3 


ALTER TABLE Customer 
DROP COLUMN 2ZIPCode; 


ALTER TABLE Customer 
ADD COLUMN CellPhone VARCHAR(15); 





图 5-26 CREATE TABLE 命 令 定 义 新 表 及 其 包含 的 所 有 列 。NOT NULL 命 令 通 
常用 于 定义 表 的 主 码 列 。ALTER TABLE 命 令 用 于 对 存在 的 表 增 加 或 删 
除 全 部 列 


SQL 92 提 供 了 多 种 标准 的 数据 类 型 ， 但 是 很 多 数据 库 版 本 没有 全 部 实现 。SQL92 还 允许 
用 户 使 用 CREATE DOMAIN 命 令 创建 自己 的 数据 类 型 。 例 如 ， 为 了 保持 一 致 性 ， 可 以 创建 一 
个 叫做 DomAddress 的 域 ， 由 CHAR(35) 构 成 。 任 何 表 用 到 地 址 列 都 可 以 引用 DomAddress。 

在 SQL 92 中 ， 确 认 主 码 和 外 码 约束 关系 。SQL 约束 是 数据 库 系统 的 强制 规则 。 为 表 Order 
定义 主 码 和 外 码 的 语法 如 图 5$-27 所 示 。 首 先 ， 注 意 每 个 约束 都 有 一 个 名 字 (例如 pkorder)。 可 
以 使 用 任何 名 字 ， 但 是 最 好 选择 一 个 容易 记忆 的 以 防 发 生 问题 。 主 码 约束 简单 地 列 出 了 那些 
构成 主 码 的 列 。 注 意 主 码 的 每 一 列 都 应 该 标记 为 NOT NULL。 


CREATE TABLE 0rder 
(OrderiD INTEGER NOT NULL， 
OrderDate DATE, 
CustomerlD INTEGER 


CONSTRAINT pkorder PRIMARY KEY (0rderiD)， 
CONSTRAINT fkorder FOREIGN KEY (CustomeriD) 
REFERENCES Customer (CustomerlD)); 


Customer 
加 下 ES 


Order 
一 一 





图 5-27 在 SQL 中 确定 主 码 和 外 码 。 码 是 DBMS 强 制定 义 的 约束 。 主 码 约束 列 
出 了 构成 主 码 的 列 。 外 码 列 出 了 当前 表 (Order) 的 列 (CustomerID ) 
连接 到 另 一 张 表 (Customer) 的 列 (CustomerID) 


如 果 察 看 相关 类 图 ， 更 容易 理解 外 码 。 只 有 在 Customer 表 中 存在 的 顾客 才能 下 订单 。 也 就 
是 说 ，Order 表 中 的 CustomerID 必 须 存在 于 Customer 表 。 因 此 , 约束 列 出 了 原始 的 Order 表 的 列 ， 
然后 指定 REFERENCE 到 Customer 表 和 CustomerID。 





第 5 章 讽 级 查询 和 子 查 询 。 173 





ALTER TABLE 和 DROP TABLE 命 令 用 于 修改 已 有 表 的 结构 。 用 DROP 命 令 时 要 小 心 ， 它 
可 能 把 整个 表 从 数据 库 中 删除 ， 包 括 数据 和 结构 定义 。ALTER TABLE 命 令 相对 平和 。 它 用 于 
表 中 ADD 或 DELETE 的 列 。 很 明显 ， 当 删除 整个 列 时 ， 存 储 在 该 列 中 的 所 有 数据 将 被 删除 。 
类 似 地 ， 当 增加 新 列 时 ， 所 有 已 有 行 会 包含 NULL 值 。 

CREATE INDEX 和 DROP INDEX 命 令 用 于 改进 数据 库 的 性 能 。 第 9 章 给 出 使 用 索引 的 优点 
和 缺点 。 一 般 来 说 ， 这 些 命令 对 于 表 是 一 次 性 问题 ， 所 以 通常 使 用 菜单 界面 更 简单 。 

最 后 ， 正 如 第 4 章 所 说 的 ，CREATE VIEW 创 建 并 保存 新 的 查询 。 基 本 的 语法 很 简单 : 
CREATE VIEW myview AS SELECT…。 该 命令 给 出 名 字 并 保存 任何 SELECT 语句 。 而 且 ， 这 
些 命令 大 部 分 情况 下 很 容易 从 菜单 界面 创建 并 执行 。 但 是 ， 有 的 时 候 必 须 手 工 创建 SQL 数据 定 
又 语句 ， 所 以 最 好 知道 该 怎么 做 。 


5.10 SQL 数据 操纵 命令 


第 三 类 SQL 命令 体现 了 SQL 的 真正 功能 。SELECT 命 令 检 索 数据 ， 而 数据 操纵 命令 改变 表 
中 的 数据 。 基 本 的 命令 和 语法 如 图 5-28 所 示 。 这 些 命令 用 于 插入 数据 、 删 除 行 、 更 新 (改变 ) 
给 定单 元 格 的 值 。 使 用 这 些 命令 时 要 记 住 两 点 ， (1) 采用 了 一 次 一 个 集合 的 数据 操作 方式 一 一 
而 不 是 一 次 一 行 ，(2) 利用 SELECT 和 WHERE 语句 前 面 的 用 法 。 


INSERT INTO target (columnl， column2 ， 
VALUES (valuel, vajue2, . . .) 


INSERT INTO target (colurml, column2, 
SELECT . . . FROM . . . 


DELETE FROM table WHERE condition 
UPDATE tabile 


SET Columnl=Valuel, Colum2=Value2, 
WHERE condition 





图 5-28 常见 的 SQL 命 令 ， 用 于 增加 、 删 除 、 修 改 已 有 表 的 数据 。 这 些 命令 对 
整个 数据 集合 进行 操作 ， 利 用 SELECT、WHERE 语 名 以 及 子 查 询 


5.10.1 INSERT 和 DELETE 


正如 图 5-28 所 示 ，INSERT 命 令 有 两 种 变化 。 第 一 种 (VALUES) 一 次 插入 一 行 数据 值 。 
除了 在 某 些 程序 中 ， 这 种 用 法 很 少 使 用 。 大 部 分 数据 库 系 统 提 供 可 视 的 或 表格 式 的 数据 输入 
系统 ， 使 输入 和 编辑 单行 数据 非常 容易 。 正 如 第 6 章 所 讲 的 ， 还 可 以 构造 表单 ， 方 便 用 户 输入 
和 编辑 单行 数据 。 

INSERT 的 第 二 种 用 法 在 从 一 张 表 向 另 一 张 表 (目的 表 ) 复制 数据 的 时 候 特别 有 用 。 任 何 
SELECT 语 句 都 是 可 以 的 ， 包 括 带 有 子 查询 的 语句 ， 这 样 它 的 功能 就 比 看 上 去 更 强 。 例 如 ， 在 
宠物 商店 数据 库 中 ， 可 能 把 较 老 的 Animal 文 件 移 到 另 一 台 机 器 上 。 为 了 移动 所 有 2004 年 1 月 1 
日 之 前 的 动物 记录 ， 将 会 用 到 图 $-29 所 示 的 INSERT 命 令 。 子 查询 根据 订购 日 期 选 定 动物 。 
INSERT 命 令 把 Animal 表 中 的 相关 行 复制 到 已 有 的 OldAnimal 表 中 。 
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INSERT INTO OldAnimals 
SELECT * 

FROM Animal 

WHERE AnimalID IN 
(SELECT AnimalOrderIitem.AnimalID 

FROM AnimalOrder INNER JOIN AnimalOrderItem 

ON AnimalOrder.OrderID = AnimalOrderIitem.OrderID 
WHERE (AnimalOrder.OrderDate= ‘01-Jan-2004") 









) ; 





图 5-29 INSERT 命 令 复 制 旧 的 数据 行 。 使 用 子 查 询 确定 需要 复制 的 行 


图 5-29 的 查询 把 部 分 指定 行 复 制 到 新 表 中 。 下 一 步 是 从 主要 的 Animals 表 中 删除 这 些 行 以 
节约 空间 ， 提 高 性 能 。DELETE 命 令 可 以 轻松 完成 这 项 工作 。 如 图 $-30 所 示 ， 只 要 把 查询 的 前 
两 行 (INSERT 和 SELECT) 换 成 DELETE 即 可 。 注 意 不 要 改动 子 查询 。 可 以 使 用 剪 切 -粘贴 功 
能 来 删除 已 经 备份 的 行 。 一 定 要 注意 DROP 和 DELETE 命 令 的 区 别 。DROP 命 令 删 除 整个 表 。 
DELETE 命 令 删 除 表 中 的 行 。 


DELETE 
FROM Animal 
WHERE AnimalID IN 

(SELECT AnimalorderItem.AnimalID 


FROM AnimalOrder INNER JOIN AMnimalorderItem 
ON AnimalOrder.OrderID = AnimalOrderItem.OrderID 
WHERE (Animalorder .OrdqerDate<'01-Jan-20047) ) 





图 5-30 DELETE 命 令 删 除 旧 的 数据 。 使 用 剪 切 和 粘贴 保证 子 查询 和 前 一 个 查 


询 相同 


5.10.2 UPDATE 


UPDATE 命 令 的 语法 和 INSERT、DELETE 命 令 类 似 ， 可 以 使 用 WHERE 子 句 的 所 有 功能 ， 
包括 子 查询 。UPDATE 命 令 的 关键 在 于 它 每 次 对 所 有 行 的 集合 操作 。 用 WHERE 子 句 指定 需要 


修改 哪些 行 。 


在 图 5-31 的 例子 中 ， 管 理 者 希望 上 调 猫 和 狗 的 ListPrice。 猫 的 价格 上 调 10%， 狗 的 价格 上 
调 20%。 因 为 有 两 种 不 同 的 动物 ， 通 常 需 要 两 个 独立 的 UPDATE 语 名 。 但 是 ， 这 个 例子 正好 适 
合 CASE 函 数 。 可 以 减少 到 只 须 一 个 UPDATA 语 句 ， 方 法 是 用 CASE 语 句 为 Cats 选 定 1.10 同 时 为 
Dogs 选 定 1.20， 代 替 值 1.10 和 1.20。 


UPDATE Animal 
SET ListPrice = ListPrice * 1.10 
WHERE Category = ‘Cat'’; 


UPDATE Animal 
SET ListPrice = ListPrice * 1.20 
WHERE Category = ‘Dog'’; 





图 5-31 UPDATE 命 令 的 例子 。 如 果 不 用 CASE 函 数 ， 使 用 两 个 独立 的 语句 为 猫 
的 价格 上 调 10%， 为 狗 的 价格 上 调 20% 
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UPDATE 语 句 还 有 其 他 的 功能 。 例 如 ， 可 以 同时 修改 几 个 列 。 只 要 用 逗号 把 列 分 开 。 还 可 
以 利用 表 中 的 行 或 查询 做 计算 。 例 如 ， 动 物 的 标价 可 以 考虑 动物 的 年 龄 ， 该 命令 为 SET 
ListPrice = ListPrice * (1 - 0.001 * (Date() - DateBorn))。 这 个 命令 规定 了 动物 自 出 生起 ， 每 天 
价格 下 降 千 分 之 一 。 

注意 最 后 一 个 例子 ， 用 内 置 函数 Pate () 给 出 了 当天 的 日 期 。 大 部 分 数据 库 系统 提供 多 个 
内 置 函 数 可 以 用 在 任何 计算 中 。 这 些 函 数 没有 标准 化 ， 但 是 可 以 从 系统 的 Help 命 令 得 到 列表 
( 即 语法 规范 ) 。 在 Microsoft Access 中 ， 可 以 通过 在 Help 中 搜索 Funtion 和 Reference 得 到 完整 的 
列表 。Date、String 和 Format 函 数 尤 其 有 用 。 

使 用 UPDATE 命 令 时 要 记 住 ， 计 算 中 用 到 的 所 有 数据 必须 在 查询 中 的 某 一 行 出 现 。 没 有 办 
法 引用 表 中 前 面 一 行 或 后 面 一 行 。 


5.11 质量 ， 查询 检查 


复杂 查询 最 大 的 挑战 在 于 即使 有 错误 也 能 得 到 结果 。 问 题 是 这 个 结果 并 不 是 希望 得 到 的 。 
保证 结果 正确 的 惟一 办 法 就 是 彻底 理解 SQL， 和 仔细 构造 并 测试 查询 。 

图 5-32 列 出 了 处 理 复杂 查询 的 基本 步骤 。 第 一 步 是 把 复杂 的 查询 分 解 成 几 部 分 ， 如 果 查 询 
中 包括 子 查 询 ， 这 一 步 尤 为 重要 。 对 每 一 个 子 查 询 单 独 检查 和 测试 。 对 于 复杂 的 布尔 条 件 也 
可 以 这 么 做 。 从 简单 的 条 件 开 始 ， 检 查 结果 ， 然 后 增加 新 的 条 件 。 如 果子 查询 正确 ， 使 用 前 
切 和 粘贴 的 办 法 把 它们 连 在 一 起 构成 主 查 询 。 一 定 要 避免 关联 子 查询 。 必 要 时 ， 把 初始 的 查 
询 保 存 为 视图 ， 然 后 用 一 个 全 新 的 查询 连接 视图 的 结果 。 第 三 步 建立 样本 数据 检查 查询 。 找 
到 或 者 创造 代表 不 同情 况 的 数据 。 


把 问题 分 解 成 几 部 分 
测试 每 一 个 查询 

检查 SQL 

观察 数据 

检查 计算 结果 
连接 子 查询 

使 用 剪 切 和 粘贴 减少 错误 


检查 关联 子 查询 

测试 样本 数据 

确认 不 同 的 情况 

检查 最 终 查询 和 子 查询 

验证 计算 结果 

先 铀 试 SELECT 查询 再 执行 UPDATE 查 询 





图 5-32 构造 可 靠 查询 的 步骤 。 执 行 UPDATE 和 DELETE 查 询 之 前 ， 一 定 要 保证 
数据 库 有 最 新 的 备份 
考虑 图 5-33 的 例子 ， 列 出 买 狗 和 猫 产品 的 顾客 。 该 查询 由 四 种 情况 构成 : 
D 顾客 在 一 次 购物 中 购买 了 狗 和 猎 产 品 。 
2) 顾客 买 了 狗 ， 在 另 一 个 时 间 买 猫 产品 。 
3) 顾客 买 了 狗 ， 从 未 买 猫 产品 。 
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4) 顾客 从 未 买 狗 ， 但 是 买 猎 产品 。 


















SELECT DISTINCT Animal .Category, Salée.CustomerIiD 
FROM Sale INNER JOIN (Animal INNER JOIN SaleAnimal 
ON Animal.AnimalID = SaleAnimal .AnimalID) 
ON Sale.SaleID = SaleAnimal .SaleID 
WHERE (((Animal .Category)=’Dog’)) 


AND Sale.CustomerID IN ( 


SELECT DISTINCT Sale.CustomerID 
FROM Sale INNER JOIN (Merchandise INNER JOIN SaleItem 
ON Merchandise.ItemID = SaleItem.ItemID) 
ON Sale.SaleID = SaleItem.SaleIiD 
WHERE (({Merchandise.Category)='Cat’)) 





图 5-33 查询 示例 : 哪些 顾客 买 了 狗 也 买 了 猫 产品 (在 任何 时 间 ) ? 每 个 查询 
分 别 构造 。 然 后 把 它们 用 SQL 连 在 一 起 并 加 到 链接 上 。 用 样本 数据 测 
试 结果 


因为 只 有 四 种 情况 ， 可 以 设置 数据 分 别 测试 。 如 果 有 上 千 种 情况 ， 只 能 测试 可 能 性 较 大 的 情况 。 

构造 查询 的 最 后 一 步 涉 及 数据 操纵 查询 〈 例 如 UPDATE)。 首 先 创建 SELECT 查询 ， 搜 索 
需要 修改 的 行 。 检 查 并 测试 保证 这 些 行 就 是 要 修改 的 。 当 查询 确认 正确 后 ， 要 有 数据 库 的 最 
新 备份 一 或 者 至 少 要 有 计划 修改 表 的 备份 。 现 在 可 以 把 SELECT 查询 改 为 UPDATE 或 
DELETE 语 句 并 执行 。 


小 结 


要 牢记 SQL 的 操作 对 象 是 数据 集合 。SELECT 命 令 返 回 符合 某 种 条 件 的 数据 集合 。 
UPDATE 命 令 改变 数据 ，DELETE 命 令 删 除 特定 集合 的 数据 行 。 集 合 可 以 由 简单 的 WHERE 子 
名 确定 ， 也 可 以 由 带 有 多 个 子 查询 和 多 个 表 的 复杂 条 件 确 定 。 理 解 SQL 的 关键 在 于 把 WHERE 
子 句 看 成 数据 集合 的 定义 。 

子 查询 功能 很 强 。 对 于 外 层 循环 的 每 一 个 值 ， 内 层 循 环 都 要 重复 一 遍 的 关联 子 查 询 必 需 小 
心 避免 。 这 种 情况 下 ， 先 创建 视图 ， 把 中 间 结 果 保 存在 一 个 独立 的 查询 中 。 还 有 ， 在 把 子 查 
询 插入 到 最 终 查询 之 前 ， 要 分 别 进行 子 查询 测试 。 

在 日 常情 况 下 ， 数 据 保存 在 一 张 表 中 而 不 是 另 一 张 。 例 如 ， 可 能 需要 最 近 没 有 下 订单 的 顾 
客 列表 。 如 果 DBMS 没 有 参照 完整 性 也 会 产生 类 似 的 问题 一 -需要 找到 在 顾客 表 中 没有 匹配 项 
的 顾客 的 订单 。 外 连接 (或 者 NOT IN 子 查询 ) 用 于 这 些 情况 。 

每 个 数据 库 系 统 都 有 内 部 函数 可 以 用 在 SQL 语句 中 。 不 幸 的 是 ， 这 些 国 数 没 有 标准 化 ， 所 
以 每 个 DBMS 使 用 不 同 的 语法 。 但 是 ， 一 些 标准 的 函数 通常 可 以 得 到 并 用 在 业务 查询 中 。 有 一 
些 处 理 日 期 和 时 间 的 重要 函数 。 例如 ，Mon 了 函数 从 一 般 的 日 期 列 中 获得 月 份 ， 允许 查询 语句 
计算 月 度 总 额 。 

最 重要 的 要 记 住 ， 即 使 构造 了 错误 的 查询 语句 ， 大 部 分 情况 仍然 可 以 执行 。 不 幸 的 是 ， 结 
果 并 不 正确 。 也 就 是 说 ， 必 须 万 分 小 心地 构造 查询 ， 并 反复 检查 。 从 一 个 小 的 查询 开始 ， 然 
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后 不 断 地 增加 元 素 ， 直 到 完成 。 在 构造 UPDATE 或 DELETE 查 询 的 过 程 中 ， 先 构造 SELECT 语 
句 ， 检 查 结果 ， 然 后 改 成 UPDATE 或 DELETE。 


开发 漫谈 
Miranda 发 现 有 的 业务 问题 比 其 他 的 复杂 得 多 。SQEL 子 查询 和 外 连接 经 常用 来 回答 这 
些 问题 。 反 复 练习 SQL 子 查询 直到 彻底 理解 。 它 们 可 以 节省 数 百 小 时 的 工作 。 考 虑 一 下 


本 章 有 些 问题 如 果 编 写 代码 需要 多 长 时 间 1 作为 课程 作业 ,创建 几 个 查询 检验 一 下 技能 ， 
包括 子 查询 和 外 连接 。 构 造 并 测试 SQL UPDATE 查 询 来 修改 数据 集合 。 可 以 使 用 SQL 创 
建 并 修改 表 。 





关键 词 
ALL DELETE LEFT JOIN 
ALTER TABLE DROP TABLE 伐 套 查询 
ANY 等 值 连接 OUTER JOIN 
CASE EXCEPT 自 反 连接 
约束 EXISTS RIGHT JOIN 
关联 子 查询 FULL JOIN 模式 
CREATE DOMAIN IN 自 连接 
CREATE SCHEMA 不 等 连接 子 查询 
CREATE TABLE INSERT UNION 
CREATE VIEW INTERSECT UPDATE 

复习 题 


1. 什么 是 子 查询 ? 什么 情况 下 使 用 子 查询 ? 
2. 什么 是 关联 子 查询 ? 它 的 问题 是 什么 ? 
3. 如 何 找到 不 在 列表 中 的 项 ? 例如 最 近 没 有 下 订单 的 顾客 。 
4. SQL 命令 可 以 分 成 哪 三 类 ? 
5. 如 果 一 张 表 的 JOIN 列 包含 的 数据 在 另 一 张 表 中 没有 相关 列 ， 该 如 何 连 接 表 ? 
6. 如 果 两 个 或 多 个 列 需 要 匹配 ， 该 如 何 连 接 表 ? 
7. 什么 是 不 等 连接 ? 什么 情况 下 使 用 不 等 连接 ? 
8. 什么 是 SQL UNION 命 令 ? 什么 情况 下 使 用 该 命令 ? 
9. 什么 是 自 反 连接 ? 给 出 可 能 使 用 自 反 连接 的 例子 。 
10. SQL CASE 函 数 的 目的 是 什么 ? 
11. 基本 的 SQL 数 据 定义 命令 是 什么 ? 
12. 基本 的 SQL 数据 操纵 命令 是 什么 ? 
13. UPDATE 和 DELETE 命 令 如 何 和 SELECT 语句 相似 ? 


练习 


Sally 的 宠物 商店 
下 面 编号 为 1~25 的 问题 基于 宠物 商店 数据 库 的 表 ， 写 出 SQL 语句 回答 这 些 问 题 。 在 数据 库 上 
测试 查询 。 提 示 : 如 果 把 问题 分 解 成 多 个 查询 ， 很 多 问题 会 简单 些 。 

1. 列 出 标价 比 所 有 产品 平均 标价 都 高 的 产品 。 

2. 平均 来 看 ， 哪 个 卖 出 的 时 间 短 : 雄性 猫 还 是 肉 性 猫 ? 

3. 列 出 卖 出 时 间 比 平均 时 间 长 的 猫 。 

4. 哪些 商品 的 平均 销售 价格 比 平 均 购 买 价格 高 50% 以 上 ? 

5. 用 占 全 部 雇员 所 有 商品 销售 百分比 的 形式 列 出 雇员 和 他 们 总 的 商品 销售 。 

6. 平均 来 看 ， 哪 些 供应 商 收取 了 占 商 品 订单 总 数 最 高 的 运输 成 本 ? 

7. 哪 位 顾客 消费 动物 和 商品 最 多 ? 

8. 哪些 顾客 在 5 月 份 购买 超过 100 美 元 的 商品 ， 而 在 10 月 份 购买 超过 50 美 元 的 商品 ? 





9. 列 出 在 第 一 季度 买 狗 ， 并 且 在 第 四 季度 买 狗 食 的 顾客 。 
10. 从 1 月 1 日 到 7 月 1 日 价格 上 涨 的 包装 狗 食 净 变 化 量 是 多 少 ? 
11. 7 月 份 哪些 标价 高 于 50 美 元 的 商品 没有 卖 出 ? 
12. 哪些 现存 的 数量 多 于 100 件 的 商品 没有 在 2004 年 订购 ? 使 用 OUTER JOIN 回答 。 
13. 哪些 现存 的 数量 多 于 100 件 的 商品 没有 在 2004 年 订购 ? 使 用 子 查询 回答 。 
14. 哪些 现存 多 于 500 件 的 猫 产 品 没 有 在 7 月 份 卖 出 ? 
15. 宠物 商店 的 哪 种 狗 从 未 售 出 ? 使 用 OUTER JOIN 回答 。 
16. 宠物 商店 的 哪 种 狗 从 未 售 出 ? 使 用 子 查询 回答 。 
17. 列 出 向 Gibson 报告 的 雇员 列表 。 
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18. 保存 查询 回答 练习 7: 每 个 顾客 消费 的 总 金额 。 如 表 所 示 ， 创 建 查询 根据 销售 额 对 顾客 分 
类 。 构 造 查询 语句 列 出 第 一 个 查询 的 每 位 顾客 ， 并 显示 合适 的 标签 。 








类 别 下 限 上 限 
差 0 200 
良 200 800 
优 800 10 000 





19. 列 出 6 月 份 所 有 宠物 商店 的 供 货 商 。 标 明 他 们 卖 动物 还 是 商品 。 

20. 列 出 花 在 动物 上 的 钱 比 在 商品 上 的 (总 数 ) 多 七 倍 的 顾客 的 州 。 

21. 创建 如 练习 18 所 示 的 表 ， 写 一 个 查询 。 

22. 向 练习 18 所 示 的 表 中 插入 第 一 行 数据 ， 写 一 个 查询 。 

23. 把 练习 18 所 示 表 第 一 行 的 上 限 修改 为 400， 写 一 个 查询 。 

24. 删除 练习 18 表 的 第 一 行 ， 写 一 个 查询 。 

25. 为 Employee 表 创建 备份 。 使 用 删除 查询 从 备份 中 删除 所 有 的 数据 。 写 出 查询 把 原始 雇员 表 
复制 到 新 表 。 复 制 在 11 月 份 没有 卖 出 商品 的 雇员 。 


TD 


二 
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ChainStay 
HeadTubeAngie 
SeatTueAngle 
ListPriee 
SalePrice 
SalesTar 
SaleState 
ShipPrice 
FramePrice 
ComponentList 





Rolling Thunder 自 行车 
下 面 编号 为 26~50 的 问题 是 基于 Rolling Thunder 数 据 库 的 表 ， 写 出 SQL 语句 回答 这 些 问 题 ， 
并 用 Access 实 现 查询 。 





26. 哪些 赛车 2003 年 的 销售 价格 高 于 2002 年 的 平均 价格 ? 

27. 在 2002 年 ， 哪 些 自行 车 相当 于 平均 产量 的 两 倍 (以 2002 年 为 准 ) ? 

28. 根据 占 总 销量 的 比例 按照 自行 车 类 型 列 出 2003 年 销量 。 

29. 2002 年 Campy R2 齿 轮 变速 器 在 赛车 上 的 安装 百分比 是 多 少 ? 

30. 列 出 至 少 购买 一 辆 公路 自行 车 和 一 辆 山地 自行 车 (任何 时 间 ) 的 顾客 。 使 用 子 查询 。 

31. 列 出 至 少 购买 一 辆 公路 自行 车 和 一 辆 出 地 自行 车 (任何 时 间 ) 的 顾客 。 使 用 JOIN 和 保存 的 
查询 。 与 练习 30 比 较 查 询 性 能 。 

32. 列 出 购买 无 避 震 山地 自行 车 ， 但 没有 购买 全 避 震 山地 自行 车 的 顾客 。 使 用 子 查询 。 

33. 列 出 购买 无 避 震 山地 自行 车 ， 但 没有 购买 全 避 震 山地 自行 车 的 顾客 。 使 用 OUTER JOIN 并 

与 练习 32 比 较 查询 性 能 。 

在 2004 年 ， 哪 个 没有 销售 (安装 ) 的 部 件 库存 价值 最 高 (根据 成 本 ) ? 

. 创建 一 个 厂商 联系 表 ， 记 录 所 有 加 利 福 尼 亚 的 制造 商 和 零售 商 。 只 包括 VendorName 和 

Phone 列 。 零 售 商 只 包括 2004 年 至 少 卖 出 一 辆 自行 车 的 店 。 

. 列 出 所 有 向 Venetiaan 报 告 的 雇员 。 

37. 列 出 公司 至 少 购买 比 2000 年 6 月 30 日 之 前 多 25% 的 部 件 。 

38. 列 出 购买 总 值 超过 当月 销售 总 值 的 部 件 和 年 /月 。 

39. 在 哪些 年 平均 制造 时 间 超 过 了 所 有 年 份 的 平均 制造 时 间 ? 

40. 列 出 在 1997 年 至 1999 年 间 至 少 消费 7 000 美 元 (不 包括 税 和 运费 )， 但 是 在 2003 年 和 2004 年 

却 没有 购买 任何 自行 车 的 顾客 。 

. 列 出 所 有 为 2003 年 7 月 前 三 天 订购 的 赛车 工作 的 雇员 。 工 作 包 括 装配 、 喷 泪 、 或 者 安装 零 

件 。 指 出 每 个 雇员 从 事 的 工作 。 

42. 哪个 雇员 从 2001 年 到 2002 年 的 销售 额 增长 率 最 高 ? 

43. 对 于 每 个 型 号 来 说 ， 从 2002 年 到 2003 年 和 2004 年 ， 年 度 销售 额 比例 变化 有 多 大 ? 

44. 自 2000 年 以 来 ， 有 多 少 顾 客 购买 了 公路 或 者 比赛 自行 车 ， 也 购买 了 某 种 类 型 的 山地 自 
行车 ? 

. 创建 一 张 新 表 (CustomerSize)， 输 入 表 中 的 数据 。 写 出 查询 为 每 个 顾客 赋予 适当 的 型 号 标 

注 ， 然 后 创建 查询 对 2003 年 和 2004 年 制造 的 各 型 号 的 自行 车 根据 类 型 进行 计数 。 
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Size RoadLow RoadHigh MTBLow MTBHigh 
小 45 52 . 14 15.5 
中 52 57 15.5 17 
大 57 65 17 23 
46. 利用 CREATE TABLE 写 查询 创建 练习 45 描 述 的 表 。 
47. 写 查询 向 练习 45 所 示 的 表 插 入 第 一 行 数 据 。 
48. 写 查询 把 练习 47 中 小 型 自行 车 的 RoadLow 值 改 为 40。 
49. 写 查询 删除 练习 46 表 的 第 一 行 。 
50. 写 查询 删除 练习 46 创 建 的 整个 表 。 





名 5 赣 诀 级 查 克 和子 查询 187 





参考 网 站 
网 站 描述 
http://www.acm.org/sigmod/ 计算 机 学 会 一 一 特别 兴趣 组 ， 数 据 管理 。 
http://www.acm.org/dl ACM 数 字 图 书馆 包括 上 千 篇 全 文 检索 文章 。 察 
看 你 的 图 书馆 是 否 有 订阅 。 
补充 读物 


Celko, J. Joe Celkos SQL Puzzles & Answers. San Mateo: Morgan Kaufmann, 1997. 
[Challenging SQL problems with solutions.] 


Iseminger, D., ed. Microsoft SQL Server 2000 Reference Library. Redmond: Microsoft 
Press, 2000. [The hardcopy documentation that does not ship with SQL Server.] 


Kreines, D., and K. Jacobs. Oracle SQL: The Essential Reference. Cambridge, MA: 
O'Reilly & Associates, 2000. [Reference book for Oracles version of SQL.] 


附录 : 编程 简介 


很 多 书 介绍 如 何 学 习 编写 计算 机 程序 。 附 录 的 目的 是 复习 编程 要 点 ， 指 出 DBMS 编 程 的 几 
个 重要 特征 。 如 果 你 是 一 个 编程 新 手 ， 应 该 找 其 他 的 书 理 解 编程 的 细节 和 逻辑 。 


1 变量 和 数据 


数据 库 环境 下 的 编程 最 重要 的 是 处 理 三 种 数据 : (1) 存储 在 表 中 的 数据 ， (2) 在 表单 和 
报表 中 控制 的 数据 ， (3) 传统 的 数据 变量 ,保存 临时 结果 。 第 3 章 重点 描述 存储 在 表 中 的 数 
据 。 第 6 章 描 述 如 何 创建 表单 和 数据 控件 。 第 8 章 给 出 更 多 的 关于 这 三 种 数据 在 构建 应 用 程序 
时 交互 作用 的 细节 。 现 在 ， 学 习 基 本 程序 变量 的 基本 内 容 。 

程序 可 以 创建 变量 保存 数据 。 一 个 程序 变量 就 像 一 个 小 箱子 : 它 可 以 保存 将 要 使 用 或 转移 
的 值 。 变 量 有 惟一 的 名 字 。 更 重要 的 是 变量 具有 固定 的 数据 类 型 。 常 见 的 变量 类 型 如 图 5-1 A 
所 示 。 一 般 地 ， 可 以 分 为 三 种 ; 整数 (1，2，-10，…)、 实 数 (1.55，3.14，…) 和 字符 串 
(‘123 Main Street' ,， ‘Jose Rojas’” ，…) 。 














Integer Double 

® 2bytes 。 8 bytes 

。 一 32768 32767 ® +/- 1.79769313486232 E-308 
Long 。 +/~ 4.94065645841247 E-324 

®。 4bytes Currency 

e 十 /一 2147,483,648 。 8 bytes 
Single 。 +/~ 922,337,203,685,477.5808 

。 4bytes String & String*n 

es。 +/— 3.402823E 38 Variant 

® +/- 1.401298 E-45 。 Any data type 
Global, Const, Static es Nul 

一 一 
图 5-1A 程序 变量 类 型 。Microsoft Access 的 变量 规模 。 注 意 货币 变量 有 助 于 防 
止 伟 人 误差 


每 一 种 变量 占有 固定 的 存储 空间 。 这 个 空间 决定 了 变量 可 以 表示 的 数据 的 范围 。 准 确 的 大 
小 依赖 于 DBMS 和 操作 系统 。 例 如 ， 一 个 简单 的 整数 占用 2 个 字 节 空间 ， 即 16 比 特 。 因 此 ， 可 
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以 表示 2 个 值 或 者 -32 768 至 32 767 之 间 的 整数 。 实 数 可 以 有 小 数值 。 通 常 有 两 种 : 单 精度 和 
双 精 度 。 如 果 不 需 要 太 多 的 变量 ， 最 好 选择 比较 大 的 变量 (长 整数 和 双 精 度 实 数 ) 。 虽 然 双 精 
度 变 量 需要 更 大 的 空间 ， 处 理 起 来 也 比较 慢 ， 但 它们 有 扩展 的 空间 。 如 果 选 择 的 变量 太 小 ， 
就 有 可 能 使 程序 崩溃 或 得 到 错误 的 结果 。 例 如 ， 用 2 字 节 的 整数 对 顾客 计数 可 能 发 生 错误 
因为 公司 很 可 能 拥有 超过 65 000 位 顾客 。 同 样 的 道理 ， 对 于 货币 值 应 该 使 用 Currency 数 据 类 型 。 
不 仅 可 以 表示 大 数 ， 而 且 可 以 避免 浮 点 数 常见 的 伟人 误差 。 

Microsoft Access 提 供 可 变数 据 类 型 ， 用 于 转换 数据 库 或 输入 表单 中 的 数据 。 可 变数 据 类 
型 有 两 个 独特 的 属性 : (1) 可 以 保存 任何 类 型 的 数据 (包括 日 期 )，(2) 可 以 识别 数据 缺失 。 
如 果 把 变量 想象 为 一 个 保存 值 的 盒子 ， 就 可 以 发 现 当 盒子 为 空 的 时 候 盒子 是 有 用 的 。 标 准 的 
程序 变量 不 检查 这 个 条 件 。Access 提 供 ISNull 函 数 ， 它 返回 一 个 可 变数 据 变量 是 否 尚未 赋值 。 


2 变量 域 


变量 的 域 和 生存 期 在 编程 中 十 分 重要 ， 尤 其 是 在 事件 驱动 的 环境 里 。 变 量 域 指 在 哪些 地 方 
可 以 访问 变量 ， 即 哪些 程序 或 代码 可 以 访问 变量 中 的 数据 。 生 在 期 指 变量 何 时 创建 和 销毁 。 这 
两 个 属性 是 相关 的 ， 一 般 是 自动 设置 的 。 但 是 ， 可 以 通过 改变 声明 变量 的 方式 重 载 标 准 程序 。 

所 有 的 数据 变量 应 该 明确 声明 ， 在 使 用 前 必须 确定 。 最 常见 的 是 使 用 Dim 语 句 ， 例 如 ， 
Dim il As Integer。 在 默认 的 情况 下 ， 变 量 的 生存 期 和 域 依赖 于 创建 的 位 置 。 最 常见 的 ， 变 量 
在 事件 函数 中 创建 ， 即 局 部 变量 。 函 数 开 始 后 ， 局 部 变量 创建 。 函 数 内 部 的 代码 可 以 使 用 该 
变量 。 但 其 他 函数 的 代码 不 能 访问 该 变量 。 当 函数 结束 后 ， 局 部 变量 及 其 数据 被 销毁 。 

图 5-2 A 表 示 一 个 表单 中 有 两 个 按钮 。 每 一 个 按 
钮 响应 一 个 Click 事 件 ， 因 此 ， 定 义 了 两 个 函数 。 每 
个 函数 拥有 一 个 叫做 让 的 变量 ， 但 是 这 两 个 变量 完全 
无 关 。 实 际 上 ， 变 量 在 点 击 按钮 之 后 创建 。 把 函数 
看 作 两 个 房间 ， 当 你 走 进 一 个 房间 ， 只 能 看 见 这 个 
房间 里 的 数据 。 当 你 离开 这 个 房间 ， 数 据 即 被 销毁 。 

但 是 ， 如 果 希 望 代码 结束 的 时 候 不 销毁 数据 , 或 | | 
者 希望 从 其 他 函数 访问 该 变量 ， 该 怎么 办 ? 办 法 有 两 ~ [Sub Button2_Click() 
个 : (1) 声明 变量 为 静态 类 型 ， 改 变 生 存 期 ， (2) 在 
另外 的 地 方 声明 变量 ， 改 变 域 。 应 该 尽量 避免 声明 静 Endsub 
态 变量 ， 除 非 绝对 必要 (这 是 非常 少见 的 )。 如 果 变 量 
是 静态 的 ， 它 将 一 直 保持 前 一 次 调用 的 值 。 在 示例 中 ， 图 5-2A 变量 域 和 生存 期 。 每 个 事件 的 函 
每 次 点 击 按钮 ，i3 保 持 前 一 次 的 值 。 可 以 用 这 种 办 法 数 拥有 独立 的 变量 ， 在 每 次 点 击 
对 按钮 点 击 次 数 计数 。 EE 

更 有 用 的 技术 是 改变 变量 声明 的 位 置 。 图 5-3 A 展示 了 事件 函数 在 表单 或 模块 中 定义 ， 是 
相关 函数 的 集合 。 变 量 i 在 整个 表单 或 模块 (位 于 Access 的 常规 部 分 ) 中 定义 。 变 量 生存 期 由 
` 表单 决定 ， 也 就 是 说 ， 当 表单 打开 和 关闭 的 时 候 ， 变 量 创建 和 销毁 。 表 单 中 的 所 有 函数 都 在 
变量 的 域 中 ， 可 以 看 见 和 修改 该 变量 的 值 。 另 一 方面 ， 其 他 表单 或 模块 的 函数 不 知道 这 个 变 
量 的 存在 。 
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过 程 或 函数 也 有 域 。 一 张 表单 中 定义 的 过 程 可 以 
由 这 个 表单 的 其 他 过 程 调用 。 如 果 需 要 从 许多 不 同 的 
表单 或 报表 访问 变量 或 过 程 ， 那 么 在 一 个 独立 的 模块 
中 定义 ， 并 声明 为 全 局 的 (或 公共 的 )。 

使 用 全 局 或 公共 变量 必须 小 心 。 程 序 员 试 图 修改 
代码 时 可 能 不 知道 变量 在 其 他 过 程 中 使 用 ， 可 能 偶然 
地 破坏 一 个 重要 的 值 。 在 表单 中 ， 全 局 变量 的 主要 目 
的 是 把 一 个 事件 中 的 值 传递 给 另 一 个 。 例 如 ， 需 要 保 ut 
持 一 个 文本 控件 的 原始 值 一 -在 用 户 修改 之 前 ， 并 把 
它 和 新 值 相 比较 。 这 需要 一 个 全 局 变量 ， 因 为 两 个 独 
立 的 事件 用 到 了 文本 控件 ，(1) 用 户 先 向 控件 输入 ， 图 53 A 全 局 本 是 i 


(2) 用 户 修改 数据 。 义 的 变量 可 以 被 该 表单 (或 模块 ) 
oa 的 任何 函数 访问 





变量 最 主要 的 目的 之 一 是 执行 计算 。 记 住 一 次 计算 只 涉及 单独 的 变量 一 一 份 数据 。 如 果 

需要 在 整个 表 中 操作 数据 ， 最 好 使 用 第 5 章 描述 的 SQL 命令 。 但 是 ， 有 时 需要 更 复杂 的 计算 。 
标准 的 算术 运算 (加 、 减 、 乘 、 除 ) 如 图 5-4 A 所 示 。 这 些 运算 符 在 大 部 分 程序 语言 中 很 

常见 。 一 些 非 标准 但 有 用 的 运算 符 包括 矫 运算 (指数 ， 

例如 2^3=2*2*2=8) ， 以 及 整数 除法 (例如; 9\2=4) ， | “算术 运算 + 一 */ 

总 是 返回 整数 。 模 函数 返回 整除 的 模 数 或 整除 后 的 余 | “ ”3 _ xy 8 

数 (例如 : 1 5mod 4=3， 因 为 15-12=3)。 如 果 希 望 知 |。 整数 除法 

道 多 少 对 象 可 以 填 人 固定 的 空间 时 ， 就 可 以 使 用 最 后 9\2=4 

两 个 函数 。 例 如 ， 如果 每 页 有 50 行 ， 而 需要 打印 185 行 ， | ” 15Nod4_ 3 url 1 3 -1 

那么 185\50=3 页 ， 第 四 页 还 有 185 Mod 50=35 行 。 


大 部 分 语言 支持 字符 串 变量 ， 用 于 保存 基本 的 文 图 5-4A 常见 的 算术 运算 符 。 加 (+)、 减 





本 数据 ， 例 如 名 字 、 地 址 或 者 简短 的 消息 。 字 符 申 是 (-)、 乘 (*)、 除 (/)。 短 和 整 
字符 的 集合 (或 数组 )。 有 时 需要 进行 字符 串 变量 计算 。 数 运算 在 特殊 任务 中 经 常 使 用 。 
在 文本 数据 上 如 何 进行 计算 呢 ? 最 常见 的 技术 是 连接 人 


(或 加 ) 两 个 字符 串 。 例 如 ， 如 果 FirstName 为 
“George”，LastName 为 “Jones”， 那 么 FirstName & LastName 为 “GeorgeJones”。 如 果 希 望 在 
名 字 间 留 有 空格 ， 那 么 需要 加 上 它 : FirstName &””& LastName。 

图 5-5A 列 出 了 一 些 常见 的 字符 串 函 数 。 可 以 从 Access 的 帮助 系统 中 学 到 更 多 的 字符 串 函 数 
和 语法 。 常 用 的 函数 包括 Left、Right、Mid， 分 别 检查 字符 串 的 相应 部 分 。 例 如 ， 可 能 希望 查 
看 字符 串 左 起 前 5 个 字母 。 


4 标准 内 部 函数 


回忆 数学 课 学 过 的 ， 在 很 多 情况 下 使 用 的 一 些 常 见 的 函数 。 如 图 5-6 A 所 示 ， 这 些 函 数 包 
括 标准 的 三 角 函 数 和 对 数 函 数 ， 用 于 制图 和 测量 相关 的 过 程 。 还 需要 函数 计算 平方 根 和 绝对 
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值 。Int (整数 ) 函数 用 于 去 掉 数字 的 小 数 部 分 。 大 部 分 语言 还 提供 随机 数 生成 器 ， 可 以 随机 
地 生成 0 和 1 之 间 的 数字 。 如 果 需 要 其 他 范围 的 数字 ， 可 以 通过 简单 的 转换 得 到 。 例 如 ， 为 了 
生成 40 和 90 之 间 的 数 ， 可 以 用 下 面 的 函数 : y = 40 + (90 - 40) * Rnd。 


& 连接 

Left, Right, Mid 

Trim, LTrim, RTrim “Frank” & “Rose” —> “FrankRose” 
String Left(“jackson”,5) —> “Jacks” 

Chr, Asc Tim(” Maria “) —> “Maria” 


LCase, UCase Len(“Ramanujan”) -一 9 
InStr String($, “a”) —> “aaaaa” 
Len Instr(“8764 Main”,” “)—> 5 
StrComp 

Format 





图 5-5A 常见 的 字符 串 函 数 包括 : 连接 字符 串 、 截 取 部 分 、 查 找 字 符 、 改 变 大 
小 写 、 比 较 两 个 字符 串 、 将 数字 格式 化 为 字符 串 变 量 


x = loge (e”) 
。 Exp, Log 三 角 函 数 
e。 Atn, Cos, Sin, Tan functions 
。 Sqr V2=1.414 2 
。 Abs Abs(—35) 一 35 
» Sgn Sgn(—35)— —1 
® Int, Fix Int(17.893) — 17 
e Rnd, Randomize RndO — 0.198474 





图 5-6 A 标准 的 数学 函数 。 即 使 在 业务 应 用 程序 中 ， 数 学 函数 也 经 常 使 用 


在 数据 库 环境 中 ， 经 常 需要 计算 和 修改 日 期 。 提 供 当 前 日 期 (Date) 和 时 间 (Now) 的 函 
数 是 有 用 的 。 业 务 处 理 中 两 个 有 用 的 函数 是 DateAdd 和 DataDiff。 如 图 5-7 A 所 示 ，DateAdd 函 
数 把 一 段 时 间 和 给 定 的 日 期 相 加 , 得 到 未 来 的 某 个 日 期 。 经 常 需要 计算 两 个 不 同日 期 相隔 儿 天 。 
不 仅 如 此 ，VBA 的 函数 还 可 以 计算 月 和 星期 的 数目 。 甚 至 可 以 计算 两 个 日 期 间 有 多 少 星期 五 。 


Date, Now, Time 
DateAdd, DateDiff 02/19/01 03/21/01 
dt LL “gq”,... 


。“yY "m", 
se Firstweekday today DateDue 


*1= Sunday,... 

。 还 可 以 计算 两 个 日 ”DateDue = DateAdd("d”, 30, Date0) 
期 之 间 有 多 少 个 星 
期 五 








图 5-7A 日 期 和 时 间 函 数 。 业 务 问 题 经 常 需要 计算 两 个 日 期 之 间 的 天 数 ， 或 者 
为 了 计算 付款 日 期 把 一 段 日 子 和 一 个 日 期 相 加 
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可 变数 据 类 型 可 以 包含 任何 数据 类 型 ， 比 如 日 期 、 数 字 和 字符 串 。 有 时， 需要 准确 地 知道 
变量 的 数据 类 型 才能 进行 操作 。 有 的 函数 ， 例 如 IsDate、IsNumberic 和 VarType 提 供 类 型 信息 。 
这 些 函 数 可 以 在 使 用 前 检查 变量 是 否 具有 合适 的 类 型 ， 以 避免 发 生 错误 。 

可 变数 据 类 型 的 另 一 个 功能 是 测试 缺失 数据 。 传 统 的 程序 变量 不 支持 这 个 功能 。 
Microsoft Access 为 此 提供 了 两 个 函数 : ISNull 和 IsEmpty。IsFull 函 数 测 试 数据 表 值 和 检查 用 户 
是 否 向 数据 项 控件 输入 值 。 


5 输入 和 输出 


在 传统 的 编程 中 ， 处 理 输入 和 输出 是 个 关键 的 问题 。 现 在 ， 这 些 问 题 仍然 重要 ,但 是 
DBMS 可 以 处 理 大 部 分 数据 处 理 程序 ， 操 作 系 统 处 理 大 部 分 用 户 界面 。 常 见 的 表单 、 报 表 ( 见 
第 6 章 ) 用 于 大 部 分 输入 和 输出 工作 。 

牢记 Windows 界 面 的 重要 特点 是 用 户 控制 数据 输入 流 ， 也 就 是 说 ， 设 计 者 提供 表单 ， 用 户 
按照 自己 的 流程 工作 而 不 受 干扰 。 偶 尔 可 能 打 断 用 户 一 一 提供 信息 或 者 获取 某 些 数据 。 一 个 常 
见 的 原因 是 发 出 错误 消息 。 这 种 功能 依赖 于 两 
个 基本 函数 : MsgBox 和 InputBox。 如 图 5-8 A 所 
示 ， 消 息 框 包含 按钮 。 按 钮 常用 于 提示 用 户 该 
如 何 处 理 问题 和 错误 。 

InputBox 是 一 种 特别 的 表单 ， 可 以 用 于 输入 
少量 文本 或 一 个 数字 。 用 户 和 开发 者 都 对 它 没 





MsgBox ("This is a message box", 


有 过 多 的 控制 。 大 部 分 情况 下 ， 最 好 设计 自己 vhYesNoCancel + vbinformation， 

的 空 表单 。 这 样 可 以 使 用 多 个 文本 框 ， 可 以 指 ey 

定 和 控制 按钮 。InputBox 经 常 在 开发 时 间 有 限 图 5-8A 消息 框 样 例 。 消 息 框 打 断 用 户 ， 提 示 用 

的 情况 下 作为 临时 合用 户 有 限 的 选择 。 它 通常 用 于 处 理 错误 和 
问题 

6 条 件 


测试 并 响应 条 件 的 能 力 是 编写 自己 的 过 程 的 一 个 最 常见 的 原因 。 基 本 的 条 件 语句 (if … 
then … else) 相对 容易 理解 。 其 结构 如 图 5-9 A 所 示 。 条 er 
件 可 能 为 真 或 假 。 如 果 为 真 ， 执 行 一 组 语句 ， 否 则 ， 执 ce 


行 第 二 组 。 ss 七 ts f fal 
条 件 可 能 很 复杂 ， 尤 其 是 条 件 包括 多 个 AND 和 OR 连 em 
接 符 。 有 的 开发 者 使 用 NOT 语 句 对 条 件 值 取 反 。 写 条 件 statements for true 





语句 时 要 小 心 。 必 须 保证 条 件 值 计算 的 正确 性 ， 保 证 其 | ple 
他 开发 者 容易 读 懂 代 码 。 
使 用 括号 可 以 指定 计算 顺序 ， 对 于 复杂 查询 ， 创 建 ” 图 5-9A 条 件 。 基 本 的 条 件 简单 明了 。 
样本 数据 及 测试 条 件 语句 。 还 要 缩 排 代 码 。 对 于 谋 套 条 条 件 语句 的 缩 进 突 出 了 关系 
件 ， 缩 排 尤为 重要 。 在 嵌 套 条 件 中 ， 一 个 条 件 语句 包括 另 一 个 条 件 语句 。 
Select Case 语 句 是 一 种 特殊 的 条 件 语句 。 许 多 过 程 需 要 计算 一 组 相关 的 条 件 。 例 如 ， 考 虑 
使 用 带 有 三 个 按钮 (是 ， 否 ， 取 消 ) 的 消息 框 的 情况 。 必 须 针对 每 个 选项 测试 用 户 选择 。 
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图 5-10 A 显示 使 用 幅 套 条 件 代 码 的 样子 。 

图 5-11 A 用 Select Case 语 句 解决 同样 问题 。 注 意 这 份 代码 可 读 性 强 。 考 虑 如 果 有 10 个 选项 
会 发 生 什么 。 开 … then 代码 变 得 更 精 糕 ， 但 是 Select Case 代 码 只 要 在 列表 的 最 下 端 增 加 新 行 
即 可 。 


response 
If (response 


MSsgBox (...) 
vbYes) Then 





response = MsgBox(...) 
Select Case response 
Case vbYes 
‘statements for Yes 
Case vbNo 
‘statements for No 
Case vbCancel 
‘statements for Cancel 
End Case 


‘statements for Yes 
Else 
If (response 


VbNo) Then 
‘statements for No 
Elise 
‘statements for Cancel 
End If 
End If 











图 5-10A 测试 用 户 响 应 的 贬 套 条 件 。 随 着 条 件 
的 增加 ， 代 码 可 读 性 变 差 


图 5-11A Select 语句 。Select 语 名 用 多 个 条 件 值 
测试 响应 变量 。 如 果 响 应 和 某 种 情况 
匹配 ， 则 执行 相应 的 代码 


7 循环 


迭代 或 循环 是 另 一 个 常见 的 程序 特征 。 虽 然 可 以 尽 可 能 多 地 使 用 SQL 语 名 (UPDATE、 
INSERT 等 )， 但 有 了 时 候 需 要 遍历 一 张 表 或 一 个 查询 ， 分 别 检查 每 一 行 。 

一 些 基本 的 循环 格式 如 图 5-12A 所 示 。 一 般 ， 如 果 已 知 循环 次 数 ， 可 以 使 用 For/Next 循 环 。 
Do 循环 是 一 种 更 加 常见 的 循环 。 循环 的 重要 特征 是 能 够 在 循环 的 开始 或 结束 处 测试 条 件 值 。 


考虑 一 个 例子 : 如果 满足 (x<=10)， 那 么 执行 相应 的 
语句 。 如 果 初 始 值 x=15 会 怎样 呢 ? 如 果 在 循环 的 开始 
处 测试 条 件 ， 那 么 循环 语句 不 会 执行 。 相 反 ， 如 果 在 
循环 结束 处 测试 条 件 ， 那 么 循环 语句 仅 在 测试 条 件 之 
前 执行 一 次 。 

和 条 件 类 似 ， 对 循环 进行 缩 排 是 良好 的 编程 风格 。 
缩 排 使 得 别人 更 容易 读 懂 代码 、 理 解 允 辑 。 如 果 循 环 
没有 问题 ， 可 以 快速 找到 循环 结束 处 。 

使 用 循环 时 需要 注意 如 果 发 生 错误 ， 计 算 机 可 
能 一 直 执 行 循环 语句 〈 对 于 大 部 分 个 人 计算 机 ， 
Ctrl+Break 可 以 终止 正在 执行 的 循环 ) 。 一 种 常见 的 错 
误 是 忘记 更 新 条 件 变量 (在 本 例 中 是 x)。 在 遍历 数据 
查询 时 ， 可 能 忘记 跳 转 到 下 一 行 数据 ， 在 这 种 情况 下 ， 
程序 就 会 反复 在 同一 行 数据 上 进行 相同 的 操作 。 写 循 


环 语 句 应 遵循 如 下 四 步 编程 习惯 : (1) 写 出 初始 条 件 ， 
(4) 写 出 内 部 代码 。 前 三 部 分 给 出 框架 。 首 先 写 出 并 测试 它们 ， 可 以 保证 


条 件 变量 的 语句 ; 
使 用 正确 的 数据 。 


Initisiize value 


Statoments 
Change value 
Test eondition 
Do Until (x > 10) Do While (x <= 10) 
' Statements ' Statements 
X=Xx+1 X=x+1t 
Loop Loop 
De Dox=1to 10 
' Statements ' Statements 
X=X+] Next x 


Loop Until (x > 10) 


图 5-12A 循环 。 所 有 的 循环 遵循 共同 的 
格式 : 初始 化 计数 器 值 ， 执 行 
循环 体 ， 增 加 计数 器 值 ， 测 试 
退出 条 件 。 可 以 在 循环 开始 或 
结束 处 测试 条 件 


(2) 写 出 结束 语句 ， (3) 写 出 更 新 


8 子 例 程 
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编程 的 一 个 重要 概念 是 把 程序 分 为 若干 更 小 子 例 程 和 函数 。 子 例 程 是 一 段 其 他 程序 可 以 调 
用 的 代码 。 当 子 例 程 结 束 时 ， 控 制 权 返回 到 调用 子 例 程 的 代码 处 。 使 用 子 例 程 的 目的 是 把 程 


序 分 成 较 小 的 片段 ， 更 容易 理解 、 测 试 和 修改 。 


子 例 程 本 质 上 是 独立 的 程序 ， 它 可 以 在 程序 中 多 处 使 用 。 例 如 ， 可 以 创建 一 个 在 屏幕 上 显 
示 状 态 消息 的 子 例 程 。 如 图 5-13A 所 示 ， 基 本 的 程序 只 写 一 次 。 在 需要 显示 状态 消息 的 时 候 调 


用 这 个 子 例 程 。 通 过 把 消息 传递 给 子 例 程 ， 实 际 的 消 
息 可 以 每 次 改变 。 使 用 子 例 程 的 优点 是 只 需要 写 一 次 
子 例 程 代码 。 还 有 ， 由 于 子 例 程 指定 了 位 置 、 风 格 和 
颜色 ， 状 态 消息 可 以 标准 化 。 如 果 需 要 改变 ， 只 需 在 
子 例 程 中 修改 少数 几 行 。 如 果 没 有 子 例 程 ， 就 必须 找 
到 并 修改 每 一 处 显示 消息 的 代码 。 

传递 给 函数 或 子 例 程 的 数据 变量 叫做 参数 。 传 递 
参数 有 两 种 基本 方案 : 传 引用 和 传 值 。 在 Microsoft 
Access 中 ， 默 认 的 方案 是 传 引 用 。 在 这 种 情况 下 ， 子 
例 程 中 的 变量 和 原 程序 中 的 是 同一 个 。 任 何 子 例 程 对 
数据 的 修改 会 自动 地 返回 给 调用 程序 。 例 如 ， 考 虑 如 
图 5-14 A 的 两 个 例子 ， 在 子 例 程 中 修改 变量 j2 的 值 ， 
会 自动 地 传 回 调用 程序 。 但 是 ， 如 果 只 传 值 ， 那 么 在 
子 例 程 中 复制 数据 变量 。 对 子 例 程 中 数据 的 修改 不 会 





Main program 


图 5-13A 子 例 程 。Status Message 子 例 程 
可 在 任何 位 置 调 用 。 当 子 例 程 
执行 完成 后 ， 返 回调 用 程序 


返回 给 调用 函数 。 除 非 确认 要 修改 调用 函数 中 的 初始 值 ， 最 好 使 用 传 值 方式 。 使 用 传 引用 的 
子 例 程 经 常 导 致 难以 发 现 程序 的 错误 。 其 他 的 程序 员 不 会 意识 到 子 例 程 改变 了 参数 值 。 


Reference 


anges to data in the 
subroutine are passed back. 






Value 
Creates a copy of the 
variable, so changes are 
not 


图 5-14A 两 种 向 子 例 程 传递 数据 的 方法 。 尽 可 能 多 地 通过 传 值 的 方法 传递 参 
数 ， 以 避免 数据 的 意外 修改 


大 部 分 语言 允许 创建 新 函数 。 函 数 和 子 例 程 在 技术 上 上 略 有 不 同 。 虽 然 子 例 程 和 函数 都 可 以 





188 冀 二 部 分 查 区 


通过 传递 引用 参数 接受 或 返回 数据 但是， 函数 可 以 直接 返回 结果 或 单个 数值 至 调用 程序 。 
例如 ， 主 程序 可 能 有 这 样 的 语句 : v1 = Min(x, y)。 函 数 可 以 选择 两 个 值 中 较 小 的 值 ， 并 把 它 返 
回 给 主 程序 ， 在 主 程序 中 ， 这 个 值 赋 给 变量 v1。 


9 小 结 


学 习 编 程 的 惟一 方法 是 自己 写 程序 。 看 书 、 查 阅 语法 文档 ， 阅 读 别 人 的 代码 会 有 所 帮助 ， 
但 是 只 有 通过 练习 才能 成 为 程序 员 。 

写 程序 时 ， 一 定 要 牢记 自己 (或 者 别人 ) 以 后 可 能 会 修改 代码 。 选 择 具有 描述 性 的 变量 名 
称 。 对 于 程序 中 技巧 性 比较 强 的 部 分 ， 以 及 每 部 分 代码 的 目的 提纲 一 定 要 写 清楚 注释 。 每 个 
部 分 和 子 例 程 规模 要 小 。 测 试 每 个 部 分 ， 并 在 文档 中 记录 测试 数据 和 结果 。 做 修改 标记 ， 这 
样 就 清楚 每 个 部 分 何 时 何故 修改 。 
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应 用 


在 数据 库 环境 中 构造 商业 应 用 程序 最 先 遇 到 的 就 是 表单 和 报表 。 大 
部 分 数据 库 管 理 系统 带 有 构造 基本 表单 和 报表 的 工具 。 然 而 ， 第 6 章 介 
绍 如 何 设计 、 修 改 表 单 和 报表 ， 使 得 这 些 工具 更 为 有 用 ， 并 且 对 用 户 友 
好 。 第 6 章 还 讨论 把 表单 和 报表 连接 成 应 用 程序 中 的 细节 问题 。 

第 7 章 主要 关注 数据 库 完 整 性 和 事务 。 探 完 如 何 保证 数据 质量 和 避 
免 在 多 个 用 户 同时 使 用 一 个 大 型 数据 库 时 所 产生 的 问题 。 

第 8 章 介 绍 如 何 处 理事 务 处 理 数据 库 和 用 于 分 析 的 系统 之 间 的 冲突 ， 
把 数据 转换 为 数据 仓库 的 问题 ， 以 及 大 型 数据 库 中 的 现代 交互 式 数 据 分 
析 技 术 。 





第 6 章 


表单 、 报 表 和 应 用 





本 章 学 习 内 容 


“输入 表单 的 目的 是 什么 ? 为 什么 不 直接 把 数据 输入 到 表 中 ? 
“表单 上 可 用 控件 的 主要 类 型 是 什么 ? 

“ 报表 的 主要 成 分 是 什么 ? 

“ 报表 的 整体 结构 是 什么 ? 

“什么 是 创建 应 用 必须 的 其 他 特征 ? 


6.1 开发 漫谈 


Ariel, 你 仔细 看 什么 呢 ? 

Miranda: 哦 ， 我 才 知 道 怎么 回答 那些 有 难度 的 问题 。 但 是 我 还 是 有 些 担心 。 很 多 次 ， 
我 得 到 了 错误 的 答案 。 我 用 SQL 必须 十 分 小 心 。 

Arial 我 相信 你 能 做 好 。 你 总 是 认真 检查 工作 。 

Miranda:， 我 希望 越 来 越 好 。 

Arial: 这 是 关键 。 现 在 你 已 经 开始 构造 应 用 程序 了 ? 

Miranda:， 是 的 。 我 看 了 一 些 关 于 表单 和 报表 的 信息 ， 比 较 简单 。 

Arial ; 真 的 ? 

Miranda: 当然 。 你 知道 最 大 的 好 处 吗 ? 所 有 的 表单 和 报表 都 是 以 SQL 为 基础 的 。 要 获 
得 所 需 数 据 ， 所 有 的 工作 就 是 构造 查询 。 甚 至 有 向 导 帮 助 创 建 基本 的 表单 和 
报表 。 

Arial. 我 一 直 相 信和 总 有 一 天 ， 人 们 会 再 次 唤起 热情 。 


6.2 简介 


表单 和 报表 是 数据 库 应 用 的 一 个 重要 部 分 。 设 计 者 使 用 它们 建立 集成 的 应 用 ， 为 用 户 提供 
工作 便利 。 决 策 者 和 职员 的 日 常 工作 以 表单 和 报表 为 基础 。 数 年 前 ， 表 单 作 为 主要 的 输入 方 
式 ， 报 表 用 于 显示 结果 。 但 是 ， 由 于 管理 者 从 联机 数据 库 获 益 更 大 ， 表 单 愈 发 重要 。 报 表 仍 
旧 用 于 发 布 或 纸 质 存储 的 输出 。 但 是 ， 表 单 可 以 以 电子 形式 发 布 ， 可 以 有 多 种 形式 的 输出 。 
互联 网 ， 特 别 是 万 维 网 变 得 越 来 越 流行 ， 这 意味 着 数据 以 电子 表单 的 形式 发 布 。 数 据 库 表单 
的 设计 原则 也 适用 于 网 络 。 
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图 6-1 小 结 如 下 ， 表 单 用 于 收集 数据 ， 显 示 查 询 结 果 ， 显 示 分 析 和 执行 运算 。 它 们 还 用 作 
导航 或 者 连接 到 其 他 表单 和 报表 。 常 见 的 如 基于 Windows 的 应 用 程序 , 表单 用 作 直 接 操作 对 象 。 
图 形 化 界面 允许 用 户 拖 放 对 象 以 示 更 改 。 有 了 这 


样 的 表单 ， 用 户 可 以 直观 地 和 表单 交互 。 人 

典型 的 报表 是 打印 在 纸 上 的 ， 但 是 越 来 越 多 。 显示 分 析 和 运算 
的 报表 用 作 直接 在 屏幕 上 显示 。 报 表 用 作 格 式 化 。 导 航 其 他 表单 和 报表 
数据 和 显示 复杂 分 析 的 结果 。 报 表 可 能 很 详细 ， “直接 操作 对 象 
占据 多 页 。 一 个 例子 可 能 是 详细 存货 报表 ， 另 一 ”图 形 





。 拖 放 


1 


方面 ， 报 表 还 可 显示 总 结 性 数据 ， 结 合 图 表 和 汇 
总 。 常 见 的 商业 例子 是 周 销售 报表 与 过 去 几 周详 ”图 6-1 数据 库 表 单 的 基本 用 途 。 理 解 表单 的 应 
细 销 售 状况 的 比较 。 报 表 通 常 是 图 形 化 的 ， 占 用 用 很 重要 ， 因 为 数据 收集 和 分 析 表 单 的 
一 页 。 设计 不 同 

应 用 程序 集中 了 相关 的 表单 和 报表 。 因 为 所 有 的 用 户 都 通过 表单 和 报表 访问 数据 库 ， 数 据 
库 的 设计 必须 符合 用 户 的 工作 。 其 他 特征 如 菜单 和 帮助 使 用 户 使 用 应 用 程序 更 为 简单 。 


6.3 ”报表 和 表单 的 有 效 设计 


设计 表单 和 报表 时 ， 最 重要 的 是 要 强调 它们 主要 用 于 和 用 户 交 互 。 每 个 表单 和 报表 必须 适 
合 特殊 情况 和 商业 应 用 。 例 如 ， 有 的 表单 可 以 言 打 一 一 录入 员 在 输入 过 程 中 不 需要 看 屏幕 。 其 
他 表单 列 出 了 探索 性 分 析 ， 决 策 者 需要 检查 多 种 情况 。 这 两 种 表单 的 特征 、 格 式 和 功能 完全 
不 同 。 如 果 选 择 了 对 用 户 来 说 是 错误 的 设计 ， 表 单 (或 报表 ) 将 完全 没 用 。 

有 效 设计 的 关键 是 确定 用 户 的 需求 。 问 题 在 于 用 户 通常 不 知道 自己 需要 什么 。 特 别 地 ， 他 
们 可 能 并 不 关心 现代 DBMS 的 能 力 和 限制 。 作 为 设计 者 ， 要 和 用 户 交 谈 ， 了 解 他 们 想 要 什么 。 
然后 根据 经 验 提供 表单 更 为 有 用 的 特征 。 小 心 找到 为 用 户 提供 帮助 和 试图 卖 给 用 户 不 需要 的 
东西 的 准确 界线 。 

人 性 化 设计 研究 者 已 经 找到 有 助 于 表单 设计 的 几 点 建议 。 首先 , 应 用 程序 (甚至 一 个 企业 ) 
中 的 所 有 表单 和 报表 应 该 尽量 一 致 。 按 键 、 命 令 和 图 标 在 整个 应 用 中 应 该 用 于 同一 目的 。 颜 
色 、 布 局 和 结构 应 该 协调 ， 这 样 用 户 可 以 理解 任何 表单 和 报表 中 的 数据 和 内 容 。 一 组 常见 任 
务 的 基本 应 用 减少 了 用 户 学 习 新 应 用 的 时 间 。 基 于 网 络 应 用 的 重要 性 正在 增长 ， 在 某 种 意义 
上 简化 了 设计 ， 因 为 只 有 大 部 分 用 户 理解 的 有 限 组 工具 。 人 性 化 设计 研究 给 出 设计 者 在 构造 
表单 和 报表 时 应 该 遵守 的 要 求 。 


6.3.1 人 性 化 设计 


图 6-2 总 结 了 一 些 系统 设计 者 在 应 用 程序 中 应 该 注意 的 人 性 化 设计 因素 。 现 在 的 操作 系统 
中 最 重要 的 因素 是 用 户 一 一 不 是 程序 员 ， 也 不 是 应 用 程序 一 应 该 始终 掌握 控制 权 。 例 如 ， 不 
要 期 待 ( 或 强迫 ) 用 户 按照 固定 的 顺序 输入 数据 。 相 反 ， 建 立 基本 的 表单 ， 并 且 人 允许 用 户 选 
择 输入 的 顺序 ， 这 样 对 于 用 户 更 简单 。 用 这 种 方式 ， 用 户 的 选择 触发 多 种 事件 。 应 用 程序 响 
应 这 些 事件 或 触发 运算 、 检 索 和 存储 数据 ， 提 供 新 的 选择 。 

还 有 ， 在 任何 可 能 的 时 候 ， 为 用 户 提供 定制 的 选择 。 许 多 用 户 希 望 改 变 显示 特征 ， 例 如 颜 
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色 、 字 体 和 大 小 。 类 似 地 ， 用 户 可 以 自己 排列 结果 和 包含 数据 。 


配合 用 户 任务 
响应 用 户 控制 和 事件 
用 户 定制 


ah 设计 和 颜色 


名 










错误 的 预报 和 校正 
删除 和 修改 的 确认 
备份 和 恢复 


图 6-2 基本 的 人 性 化 设计 因素 。 所 有 的 设计 都 应 该 遵守 这 些 基本 特征 


布局 〈 设 计 和 颜色 ) 和 期 望 的 行为 在 应 用 程序 中 应 该 保持 一 致 。 在 用 户 行为 方面 ， 小 心 保 
证 基本 特征 的 一 致 性 ， 例 如 在 输入 结束 时 是 否 需 要 按 回 车 键 ， 哪 个 功能 键 触 发 帮助 系统 ， 方 向 
键 如 何 使 用 ， 每 个 图 标的 含义 。 这 些 行 为 在 整个 应 用 程序 中 应 该 一 致 。 这 个 原则 看 上 去 是 显然 
的 ， 但 是 实现 很 有 挑战 性 一 一 尤其 当 许多 设计 者 和 程序 员 同 时 建立 应 用 的 时 候 。 有 两 点 经 验 可 
以 保证 实现 一 致 : (1) 开始 的 时 候 ， 建 立 设计 标准 和 基本 的 模版 供 所 有 的 设计 者 使 用 ，(2) 在 
应 用 程序 接近 尾声 的 时 候 不 断 返 回 检查 一 致 性 。 

始终 为 清晰 而 努力 。 在 许多 情况 下 ， 清 晰 意味 着 保持 应 用 程序 简单 和 良好 的 组 织 。 如 果 应 
用 程序 有 多 个 表单 和 报表 ， 根 据 用 户 的 工作 组 织 它们 。 应 用 程序 有 一 个 明确 的 目的 ， 帮 助 确 
保 设计 加 强 这 种 目的 。 使 用 准确 的 术语 ， 如 免 含混 的 语言 ， 使 用 企业 内 部 的 词汇 。 如 果 一 个 
公司 把 他 的 员工 叫做 “会 员 "， 那 么 使 用 这 个 词 代替 “员工 。 

美学 在 用 户 界面 中 扮演 重要 的 角色 。 目 标 是 使 用 颜色 和 设计 (有 时 包括 声音 ) 加 强 表单 和 
报表 。 避 免 初学 者 的 错误 ， 即 每 个 表单 使 用 不 同 的 颜色 ， 或 者 在 一 页 上 设置 10 种 不 同 的 字体 。 
虽然 设计 和 艺术 带 有 很 大 的 主观 性 ， 但 是 差 的 设计 相对 其 他 非常 明显 。 如 果 在 设计 中 没有 美 
学 经 验 ， 可 以 考虑 选修 一 两 门 艺术 或 设计 课程 。 如 果 没 有 机 会 ， 学 习 别人 的 工作 ， 从 中 获得 
灵感 ， 训 练 自己 的 艺术 灵感 ， 跟 随 当 前 的 潮流 。 记 住 绘图 和 艺术 非常 重要 。 它 们 为 用 户 提供 
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有 吸引 力 的 和 熟悉 的 环境 。 

反馈 对 于 大 部 分 人 机 交互 非常 关键 。 人 们 希望 知道 当 他 们 按键 、 选 择 选项 或 选择 图 标的 时 
候 ， 计 算 机 识别 他 们 的 行为 并 且 响 应 。 典 型 的 反馈 使 用 包括 接受 输入 、 确 认 修改 数据 、 突 出 
完成 工作 、 或 者 表示 事件 的 开始 或 结束 。 提 供 反馈 的 时 候 可 以 使 用 几 个 选项 。 视 觉 上 ， 光 标 
可 以 改变 形状 、 文 本 可 以 高 亮 显示 、 按 钮 可 以 “ 按 下 ”或 者 盒子 可 以 改变 颜色 。 更 直接 的 反 
馈 形 式 例如 在 屏幕 上 显示 消息 ， 可 以 在 更 复杂 的 情况 下 使 用 。 一 些 系统 利用 声音 反馈 ， 当 用 
户 选择 一 项 工作 或 当 计算 机 完成 一 项 操作 时 ， 播 放 一 段 音 乐 或 声音 。 如 果 决 定 使 用 声音 反馈 ， 
必须 给 用 户 提 供 一 个 选择 一 一 有 些 人 不 喜欢 “吵闹 的 ”计算 机 。 另 一 方面 ， 不 要 草率 地 放弃 使 
用 声音 反馈 一 一 对 于 视力 差 的 人 这 种 方式 特别 有 效 。 类 似 地 ， 当 用 户 视 觉 集中 在 另外 的 工作 上 
不 能 看 计算 机 屏幕 时 ， 声 音响 应 非常 有 用 。 

人 类 偶尔 会 犯错 误 或 改变 想法 。 作 为 设计 者 ， 需 要 明白 这 些 可 能 性 并 在 应 用 程序 中 给 他 们 
提供 机 会 。 特 别 地 ， 应 用 程序 应 该 能 够 预见 和 修改 错误 。 删 除 和 主要 的 更 新 需要 确认 一 一 给 
户 机 会 确认 修改 ， 甚 至 取消 操作 。 最 后 ， 整 个 应 用 程序 应 该 包括 数据 的 备份 和 恢复 的 机 制 一 一 
以 防 自 然 灾难 和 偶然 的 删除 造成 数据 丢失 。 


6.3.2 Windows 控 件 





在 Windows 下 设计 应 用 程序 需要 对 Windows 界 面 的 深入 了 解 : 一 部 分 因为 需要 提供 标准 控 
件 和 Windows 支 持 的 操作 ， 另 外 一 部 分 是 因为 Windows 人 允许 在 应 用 程序 中 轻松 提供 附加 的 、 强 
大 的 功能 。 
基本 的 窗口 如 图 6-3 所 示 。 窗 日 由 框架 、 标 题 栏 、 控 制 菜单 框 和 多 个 标准 按钮 组 成 。 用 户 
可 以 调整 框架 的 大 小 或 设 为 固定 尺寸 。 确 定 给 每 个 表单 提供 了 简明 标题 。 控 制 菜 单 框 提供 标 
准 的 命令 ， 包 括 移动 、 调 整 大 小 和 关闭 表单 。 常 见 的 窗口 按钮 包括 最 大 化 (全屏) 和 最 小 化 
( 推 到 屏幕 下 方 ) 还 有 关闭 。 滚 动 条 允许 用 户 水 平和 垂直 滚动 表单 。 应 用 程序 或 DBMS 通 常 自 
动 控制 这 些 行为 。 自 己 创建 的 表单 可 以 删除 这 些 标准 控件 ， 但 是 不 要 这 么 做 。 更 重要 的 是 ， 
可 以 重 载 这 些 标准 动作 提供 附加 的 功能 。 例 如 ， 当 关闭 表单 的 时 候 ， 可 以 做 一 些 清理 工作 。 
常见 的 清理 工作 包括 重新 计算 总 数 ， 保 存 修改 的 数据 ， 触 发 其 他 表单 中 匹配 的 改变 ， 或 者 当 
一 张 表 的 内 容 变化 时 同步 另 一 张 表 的 显示 。 
2 窗口 组 件 
4 框架 (可 调整 大 小 ) 一 -~ 
4 标题 栏 3 
4 控制 菜单 框 
4 按钮 
+ 最 小 化 
+ 最 大 化 
+ 关闭 


+ 滚动 框 〈 滑 块 ) 
+ 滚动 条 


图 6-3 Windows 界 面 。 窗 口 包括 几 个 常见 的 组 件 。DBMS 负 责 窗口 需要 的 主要 
操作 。 但 是 ， 可 以 经 常 向 这 些 操作 添加 功能 或 命令 


菜单 是 应 用 程序 的 重要 特征 。 大 部 分 用 户 (公正 地 说 ) 期 望 使 用 菜单 访问 每 项 工作 的 主要 
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功能 。 最 常用 的 菜单 是 下 拉 菜 单 ， 在 屏幕 顶端 显示 ， 如 图 6-4。 菜 单 包括 一 系列 动作 ， 通 常 按 
照相 关 命令 分 组 ， 由 分 隔 线 分 开 。 鼠 标点 击 可 以 激活 菜单 ， 或 者 按 下 键盘 上 的 加 速 字母 做 出 
选择 。 加 速 字母 一 般 是 菜单 上 加 下 划 线 的 字母 〈 例 如 ，Eile 命 令 的 E) 。 在 标准 PC 上 ， 这 些 命令 
以 Alt 键 开始 。 大 部 分 应 用 程序 还 定义 了 快捷 键 一 一 尤其 对 于 常见 的 命令 。 这 些 命令 一 般 和 Ctrl 








图 6-4 窗口 菜单 。 标 准 的 菜单 显示 在 屏幕 的 顶端 ， 弹 出 式 菜单 与 上 下 文 相关 ， 
随 选中 内 容 的 不 同 而 不 同 

偶尔 开发 大 员 使 用 弹出 式 菜单 或 快捷 键 。 使 用 鼠标 右键 触发 弹出 式 菜单 在 屏幕 上 设置 各 种 
对 象 的 属性 的 技术 越 来 越 流行 。 弹 出 式 菜单 和 标准 的 固定 菜单 的 最 大 不 同 在 于 ， 弹 出 式 莱 单 
通常 是 上 下 文 相关 的 。 上 下 文 相关 菜单 根据 用 户 选 中 内 容 的 不 同 而 不 同 。 

很 多 表单 和 应 用 程序 的 一 个 有 用 特征 是 弹出 消息 框 。 如 图 6-5 所 示 ， 消 息 框 是 一 个 简单 的 
窗口 ， 几 乎 没有 控件 。 它 用 于 显示 短 的 、 单 行 消息 ， 用 于 从 用 户 那里 获得 简单 的 反馈 (通常 
为 : 是 / 否 )。 一 般 来 说 ， 最 好 避免 使 用 消息 框 ， 因 为 它们 剥夺 了 用 户 的 控制 权 。 在 极端 的 情况 
下 ,模式 框 在 屏幕 上 具有 优先 权 ， 强 迫 用 户 处 理 之 后 才能 继续 工作 。 这 种 类 型 的 消息 框 常用 
于 处 理 错误 或 建立 打印 机 一 一 这 时 需要 中 断 。 设 置 模式 属性 为 “是 ”就 可 以 得 到 模式 框 。 但 是 ， 
需要 再 次 重复 下 面 的 建议 ， 避免 模式 框 ， 它 们 和 剥夺 了 用 户 的 控制 权 。 





图 6-5 消息 框 。 消 息 框 是 一 个 简单 的 窗口 ， 几 乎 没有 按钮 。 尽 量 避 免 使 用 它 ， 
因为 它 打 断 了 用 户 的 正常 工作 。 通 常用 于 警告 用 户 发 生 问 题 或 提供 即时 
选择 
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6.3.3 用 户 界面 一 ~ 网络 要 点 


在 很 多 方面 ， 网 络 环境 和 标准 的 Windows 环 境 十 分 类 似 。 可 以 控制 布局 、 颜 色 和 数据 输入 。 
网 页 和 表单 的 重要 特征 是 标准 化 ， 这 样 在 几乎 所 有 的 客户 计算 机 或 浏览 器 中 以 相同 的 方式 显 
示 。 用 户 理解 一 些 基本 的 界面 特征 : 点 击 超 链 接 转向 新 页 面 ， 点 击 按钮 提交 表单 ， 下 拉 菜 单 
用 于 选择 项 ， 等 等 。 

开发 网 络 应 用 时 ， 最 好 使 用 样式 表 。 样 式 表 对 于 设计 一 致 的 网 络 表单 是 一 种 有 效 的 工具 。 
它 介 许 定义 标准 的 布局 和 颜色 用 于 所 有 的 网 页 。 修 改 样式 表 的 几 个 参数 可 以 定义 所 有 网 页 的 
修改 ， 创 建 网 站 的 新 样式 。 


6.3.4 用 户 界面 一 一 访问 问题 


Windows 界 面 最 强大 的 功能 在 于 其 对 图 形 的 组 织 ， 人 们 仅 需 要 移动 鼠标 或 在 屏幕 上 做 出 选 
择 就 可 以 完成 复杂 的 操作 。 这 种 界面 的 缺点 在 于 ， 系 统 做 到 良好 的 用 户 可 访问 比较 困难 ， 面 
临 一 些 实际 的 挑战 。 作 为 设计 者 ， 应 使 应 用 程序 适宜 广大 用 户 。 首 先 ， 应 用 程序 应 该 可 以 接 
收 多 种 输入 。 不 仅 依赖 鼠标 ， 还 要 使 用 键盘 ， 还 有 越 来 越 多 的 用 户 语音 。 类 似 地 ， 多 种 类 型 
的 输出 对 于 应 用 程序 也 十 分 有 用 。 考 虑 集成 声音 输出 会 越 来 越 重要 。 用 户 必 须 能 够 设置 输出 
的 颜色 和 规模 。 

微软 的 指导 提供 了 一 些 制作 适宜 更 多 用 户 的 应 用 程序 的 建议 。 详 细 信息 和 最 新 的 发 展 可 以 
在 网 站 上 找到 。 根 据 其 他 应 用 程序 总 结 的 经 验 ， 提 供 一 些 特殊 的 人 性 化 的 建议 。 例 如 ， 不 要 
使 用 红 - 绿 色 组 合 。 大 约 10% 的 美国 男性 在 辨识 红 绿 中 遇 到 困难 。 选 择 对 大 部 分 用 户 可 以 区 分 
的 对 比 度 高 的 颜色 〈 例 如 黑色 和 自 色 ， 黄 色 、 蓝 色 和 红色 )。 如 果 有 疑问 ， 请 人 检验 所 选 颜色 
组 合 ， 或 者 让 用 户 自 己 选 择 喜 欢 的 颜色 。 

第 二 , 避免 要 求 用 户 做 出 快速 的 响应 。 不 要 对 输入 做 出 时 间 限 制 。 虽然 在 游戏 中 非常 有 趣 ， 
但 是 很 多 用 户 输入 速度 很 慢 。 一 些 设计 者 在 输入 数据 一 段 时 间 后 使 用 弹出 消息 检查 用 户 进度 。 
这 类 消息 通常 没有 意义 且 令 人 厌烦 。 在 现代 屏幕 保护 安全 系统 中 ， 用 户 可 以 设置 自己 的 延迟 
控件 和 消息 。 

第 三 ， 避 免 使 屏幕 快速 闪 动 的 控件 。 它 们 会 使 大 部 分 用 户 恼 怒 。 最 糟糕 的 是 ， 某 种 频率 的 
闪 动 可 以 在 部 分 人 中 诱发 阁 痛 发 作 。 在 1997 年 末 ， 日 本 就 发 生 了 一 件 有 趣 的 事情 ， 当 电视 播 
放 一 系列 办 动 的 图 形 时 ， 大 约 700 名 儿童 被 送 往 医院 。 

第 四 ， 尽 可 能 允许 用 户 自 定义 屏幕 。 人 允许 他 们 选择 字体 、 字 号 和 屏 莫 颜色。 这样， 用 户 可 
以 调整 屏幕 ， 补 偿 任何 可 能 具有 的 视觉 缺陷 。 如 果 使 用 声音 ， 人 允许 用 户 控制 音量 ， 如 果 可 能 ， 
甚至 音调 。 在 许多 情况 下 ，Windows 环 境 提供 大 部 分 此 类 功能 ， 关 键 在 于 避免 重 载 这 些 功 能 。 
还 有 ， 应 该 在 多 个 计算 机 上 测试 应 用 程序 。 有 的 视频 系统 可 能 扭曲 颜色 选择 ， 或 者 不 支持 表 
单 显 示 所 要 求 的 分 辩 率 。 


6.4 表单 布局 


独立 的 表单 或 者 窗口 是 与 应 用 程序 用 户 交流 的 主要 方式 。 表 单 用 于 收集 数据 ， 显 示 结 果 ， 
组 织 整个 系统 。 从 数据 库 的 角度 看 ， 应 用 程序 从 几 种 标准 类 型 的 表单 开始 构造 。 从 这 些 基 本 
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布局 开始 工作 ， 记 住 可 以 创建 复杂 的 使 用 多 个 不 同 表单 布局 的 表单 。 但 是 ， 首 先 应 该 理解 布 
局 和 每 种 独立 表单 类 型 的 使 用 。 

常用 的 有 四 种 表单 : (1) 表格 表单 ， 数 据 按 行列 显示 ; (2) 单行 表单 ， 每 次 显示 一 行 ， 
其 中 ,设计 者 可 以 设置 屏幕 上 数值 的 形式 ， (3) 子 表单 ， 显 示 来 自 两 张 具 有 一 对 多 关系 的 表 
的 数据 ， (4) 导航 表单 ， 或 菜单 ， 把 用 户 指向 应 用 程序 的 其 他 表单 或 报表 。 

如 图 6-6 所 示 ， 表 单 具 有 一 些 共同 点 。 可 以 设置 它们 的 属性 控制 表单 的 显示 风格 。 另 外 ， 
表单 包含 控件 , 其 中 包括 用 于 显示 基本 文本 和 数据 的 标签 和 文本 框 。 表单 还 可 以 带 有 多 个 事件 。 
例如 ， 打 开 和 关闭 对 于 每 个 表单 都 是 基本 事件 。 可 以 通过 创建 事件 响应 行为 控制 表单 的 动作 。 





图 6-6 表单 布局 。 表 单 上 放置 的 控件 用 于 显示 或 收集 数据 。 表 单 的 样式 由 其 属 
性 设置 定义 。 表 单 的 行为 由 响应 表单 事件 的 创建 行为 控制 
虽然 表单 可 以 有 多 个 控件 (例如 文本 框 )， 但 在 某 个 时 刻 只 能 有 一 个 控件 具有 焦点 。 具 有 
焦点 的 控件 接受 用 户 的 键盘 输入 。 这 个 控件 的 边框 通常 高 亮 显 示 或 颜色 不 同 。 同 样 的 概念 适 
用 于 屏幕 上 同一 应 用 程序 的 多 个 表单 。 同 一 时 刻 只 有 一 个 表单 具有 焦点 。 在 一 个 表单 中 ， 用 
户 通常 可 以 使 用 Tab 键 按照 一 定 的 顺序 从 一 个 控件 移动 到 下 一 个 ， 这 就 是 Tab 顺 序 。 一 定 要 检 
查 所 有 表单 的 Tab 顺 序 ， 保 证 其 与 表单 的 布局 一 致 。 


6.4.1 表格 表单 


如 图 6-7 所 示 ， 最 简单 的 表单 是 表格 表单 ， 可 以 显示 表 或 查询 的 行 和 列 。 它 可 以 用 做 子 表 
单 ， 但 是 很 少 作为 单独 表单 使 用 。 表 格 表 单 和 数据 表 有 所 不 同 。 表 格 表单 提供 更 多 的 控件 显 
示 方 案 一 例如 三 维 控件 和 独立 的 颜色 设置 。 数 据 表 视 图 作为 子 表单 比 表 格 表单 占用 空间 更 小 ， 
更 像 电子 表格 。 

表格 表单 的 主要 特征 是 显示 多 行 编辑 数据 。 这 样 ， 用 户 可 以 查看 和 比较 多 个 数据 项 。 它 适 
用 于 数据 较 少 的 情况 。 如 果 要 编辑 的 表 太 大 一 一 行列 数 太 多 ， 可 能 会 出 现 问题 。 如 果 用 户 需 要 
反复 滚动 表单 才能 找到 某 个 特定 的 数据 ， 表 格 表 单 的 使 用 会 发 生 困难 。 

表格 表单 常用 于 子 表单 ， 收 集 并 显示 与 主 表 单 相 关 的 有 限 数据 。 例 如 ， 订 货 表单 通常 含有 
和 OrderItem 表 相关 的 子 表单 ， 显 示 当 前 显示 的 订单 中 的 订货 列表 。 


6.4.2 单行 或 单列 表单 
单行 表单 每 次 显示 一 行 数据 ， 其 目的 是 显示 每 一 列 。 最 大 的 特征 是 设计 者 可 以 在 表单 的 任 
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何 位 置 显示 数据 。 把 表单 设计 得 看 起 来 像 传统 的 纸 质 表格 非常 有 用 。 为 了 方便 使 用 ， 设 计 者 
还 可 以 使 用 颜色 、 图 形 和 命令 按钮 。 如 图 6-8 所 示 ， 此 类 表单 设计 需要 导航 控件 ， 允 许 用 户 前 
后 跳 转 到 其 他 行 。 常 见 的 导航 控件 还 包括 跳 转 到 第 一 行 、 最 后 一 行 和 某 个 特定 行 的 按钮 。 


四 Animal1 

wimalD Name Categoy Breed spom Gender Registered Color istPri 
是 eH 00 
From oo Mass [aMae 可 Fedgowm | $174.06 
| TEwene [et JBombay fais [Mae 可 后 [Back | 327354 
站 wanda oo NookTerFoo[Fenae 梧 PC [Red 三 355 
| ren Joo ~ [SiberanHu 2004 [Femae -JIAKE edvwm| 56679 
天 


12TLesha foo Fotweier [2004 [Female = Brown $164.06 
13[ Jish Te JalMae <] ed ~ | $1200 
14『 loa [Sphwx Jao04 [Femae 可 CA [dod $143.34 
15JBorta [bog JCockerSpa Female 之 KE [S04g | $284.85 -> 
Record: 14|1 <4 2 tklolt i 
图 6-7 表格 表单 示例 。 定 义 一 行 的 控件 ，DBMS 显 示 查 询 中 所 有 行 的 数据 。 借 
助 滚动 条 ， 用 户 可 以 看 见 更 多 的 行 (或 者 数据 列 ) 





3 Animal 


Bmn | 
po 


$174.06 证 
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图 6-8 一 个 简单 的 单行 表单 。 这 个 表单 每 次 显示 一 行 数据 。 通 过 控件 可 以 设置 
样式 、 颜 色 、 图 形 和 命令 按钮 。 底 部 的 导航 按钮 允许 用 户 显示 不 同 的 行 
一 般 而 言 , 需要 包括 一 个 查看 命令 允许 用 户 定位 到 某 个 特定 的 数据 行 一 -基于 某 行 的 数据 。 
例如 ， 显 示 顾 客 数 据 的 表单 应 该 可 以 按照 顾客 的 名 字 搜 索 。 类 似 地 ， 用 户 经 常 需要 按照 不 同 
的 顺序 对 行 排序 。 
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单行 表单 大 概 是 最 常用 的 表单 布局 。 通 过 精心 的 设计 ， 它 可 以 显示 大 量 的 数据 。 通 过 包含 
子 表单 ， 可 以 突出 不 同 数据 的 关系 ， 并 且 方 便 用 户 输入 数据 。 还 可 以 包括 图 表 帮 助 用 户 进行 
决策 。 


6.4.3 子 表单 


子 表单 通常 是 主 表 单 中 息 和 的 表格 表单 。 子 表单 经 常 显示 一 对 多 关系 。 在 图 6-9 的 例子 中 ， 
一 条 销售 记录 包括 多 个 动物 ， 所 以 需要 子 表单 显示 这 个 重复 的 列表 。 主 表单 必须 是 单行 表单 ， 
并 且 子 表单 应 该 是 表格 表单 。 


0 典型 的 一 对 多 关 和 对。 
c 子 表单 的 内 容 通商 公共 列 与 主 表单 相连 (在 子 表 单 中 不 显示 )。 


) 
6 可 俯 具 有 多 个 兴 表 单独 立 或 联 套 ) 。 











图 6-9 子 表单 示例 。 主 表单 基于 Sale 表 ， 和 子 表单 中 使 用 的 SaleAnimal 表 具有 
一 对 多 关系 。 数 据 表 视 图 用 于 子 表单 一 次 显示 多 行 


如 果 观 察 图 6-9 的 表 ， 可 以 看 出 SaleID 把 主 表单 (基于 Sale 表 ) 和 子 表单 (基于 SaleAnimal 
表 ) 连接 起 来 。 很 少 在 子 表单 中 显示 连接 列 。 一 般 来 说 ， 这 样 做 没有 意义 ， 因 为 连接 列 和 主 
表单 中 相关 的 列 始终 显示 相同 的 值 。 考 虑 对 于 记录 这 意味 着 什么 。 当 新 的 销售 记录 创建 时 ， 
Sale 表 的 SaleID 由 DBMS 生 成 。SaleAnimal 表 也 有 SaleID 列 ， 每 个 卖 出 的 动物 必须 包含 相同 的 
来 自主 表单 的 SaleID 值 。 记 录 员 对 每 个 卖 出 动物 在 子 表单 中 重复 输入 SaleID 值 是 很 痛苦 的 。 通 
过 使 用 子 表单 和 指定 SaleID 作 为 连接 (Master 和 Child 属 性 )，DBMS 自动 向 子 表单 的 表 中 输入 
主 表单 的 SaleID。 

大 部 分 数据 库 系 统 支持 创建 具有 多 个 子 表单 的 表单 。 子 表单 可 以 是 独立 的 一 一 作为 主 表单 
的 独立 框 ， 也 可 以 是 风 套 的 一 每 个 子 表单 存在 于 另 一 个 之 中 。 大 部 分 情况 ， 期 望 父 表单 是 单 
行 表单 。 但 是 ， 一 些 系 统 支持 表格 表单 作为 主 表单 和 子 表单 。 大 部 分 应 用 程序 中 ， 用 户 对 此 
不 知 所 措 : 他 们 必须 先 从 父 表单 种 选择 一 行 ， 再 在 子 表单 中 匹配 。 
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6.4.4 导航 表单 


导航 表单 或 菜单 表单 提供 应 用 程序 的 全 局 结构 。 虽 然 需要 图 形 化 设计 的 帮助 ， 但 是 创建 它 
们 简单 易 行 。 导 航 表单 通常 包括 图 片 ， 设 计 反 映 了 公司 的 风格 。 

从 空白 表单 开始 ， 移 去 任何 滚动 条 和 导航 控件 。 图 片 可 以 作为 背景 插入 ， 或 者 作为 独立 控 
件 用 作 打 开 另 一 个 表单 的 按钮 。 如 图 6-10 所 示 ，, 命令 按钮 或 连接 几乎 是 导航 表单 最 重要 的 特征 。 
当 用 户 选择 一 个 按钮 ， 相 关 表单 或 报表 就 打开 了 。 主 导航 表单 使 用 频繁 ， 应 该 精心 设计 。 
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图 6-10 导航 表单 示例 。 按 钮 匹配 用 户 的 工作 


成 功 的 应 用 程序 的 关键 从 导航 表单 开始 ， 不 仅 是 设计 ， 还 包括 内 容 。 表 单 应 该 满足 用 户 的 
工作 需要 。 一 种 做 法 是 首先 识别 用 户 ， 然 后 提供 一 组 适合 他 (或 她 ) 的 工作 的 选项 按钮 。 考 
虑 一 个 简单 的 例子 。 管 理 者 需要 打印 每 天 最 畅销 的 商品 的 销售 日 报 。 每 周 DBMS 必 须 打 印 雇员 
的 销售 总 额 清单 。 公 司 每 月 还 向 最 佳 顾客 发 信 ， 提 供 额 外 的 折扣 。 秘 书 负责 打印 这 些 报表 ， 
所 以 建立 一 个 简单 的 菜单 列 出 这 些 报表 。 秘 书 从 中 选 出 想 要 的 报表 。 有 的 报表 可 能 提出 问题 ， 
例如 使 用 哪 周 的 数据 。 秘 书 输入 答案 ， 报 表 就 能 打印 出 来 。 

创建 应 用 程序 的 第 一 步 是 考虑 谁 使 用 。 他 们 如 何 工作 ? 数据库 输入 和 报表 怎样 配合 工作 ? 
目标 是 设计 一 个 菜单 系统 反映 他 们 的 工作 方式 。 图 6-11 是 两 份 首 菜单 的 示例 。 哪 个 菜单 更 适合 
办 事 员 理解 ?2 和 工作 最 相关 的 那个 。 一 旦 理解 了 基本 工作 ， 写 下 相关 菜单 组 。 一 些 菜单 选项 
调用 其 他 的 ， 一些 打印 报表 ， 另 一 些 激活 已 建 的 输入 界面 。 


主 菜单 





图 6-11 设计 用 户 菜单 。 秘 书 更 容易 理解 哪个 菜单 ? 设计 应 用 程序 时 ， 应 该 使 
应 用 程序 配合 用 户 的 工作 流程 
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6.5 建立 表单 


建立 表单 的 第 一 步 是 一 定 要 理解 表单 的 目的 以 及 如 何 使 用 它 。 它 的 用 途 规定 了 数据 如 何 显 
示 。 一 旦 知道 了 需要 的 数据 ， 就 可 以 从 数据 库 中 找到 存储 相关 数据 的 表 。 要 记 住 重要 的 一 点 : 
表单 应 该 一 次 只 更 新 一 张 表 的 数据 。 例 如 ， 常 见 的 销售 记录 表单 可 能 显示 这 些 数 据 ; Sale、 
Customer、 部 分 SaleItem、 或 许 还 有 关于 Products 的 详细 数据 。 通 过 设计 过 程 ， 这 些 数 据 需 要 
存储 在 四 张 相 关 的 表 中 ， 那 么 ， 如 何 创建 表单 ， 只 更 新 一 张 表 呢 ? 

这 个 问题 的 答案 实际 上 决定 了 很 多 数据 库 系 统 的 特征 。 只 能 把 一 张 表 放 在 一 个 表单 中 的 原 
因 是 多 表 给 表单 理解 用 户 究竟 想 做 什么 带 来 困难 。 例 如 ， 如 何 使 主 Sales 表 单 包含 Sales 表 和 
Customer 表 的 所 有 列 ， 增 加 新 行 意味 着 什么 ?新 行 应 该 加 入 Sales 表 还 是 Customer 表 ? 

很 多 时 候 需要 显示 多 张 表 的 数据 。 有 几 种 办 法 。 可 以 使 用 多 个 连接 的 表单 。 可 能 在 表单 中 
建立 分 区 ， 每 一 分 区 保存 新 的 连接 的 表 。 这 些 分 区 之 一 可 以 是 子 表单 ， 其 中 包含 连接 到 主 表 
单 的 重复 的 数据 行 。 根 据 数据 库 系 统 的 不 同 ， 可 以 使 用 可 更 新 的 查询 来 显示 多 表 数 据 。 


6.5.1 可 更 新 的 查询 


一 张 表 单 中 多 表 的 问题 和 可 更 新 查询 的 问题 相关 。 如 果 系 统 支 持 可 更 新 的 多 表 查 询 ， 那 么 
把 从 多 张 表 中 精心 选择 的 列 放 入 一 张 表单 是 可 能 的 。 图 6-12 展 示 常 见 的 Sales Order 主 表单 。 
Sale 表 保存 CustomerID 作 为 外 码 。 为 了 记录 销售 ， 销 售 员 需 要 输入 合适 的 顾客 ID 号 。 但 是 记 住 
这 些 ID 号 并 不 容易 ， 在 主 表单 中 显示 匹配 的 顾客 数据 来 检验 名 字 和 地 址 非常 好 。 








Customer 
lstomeriD ”First Last 
Connie Fisher 
Rosie Wade 
Carly Embry 









图 6-12 Order 表 单 建 立 在 查询 之 上 。 查 询 包括 Sale 表 的 所 有 列 和 Customer 表 的 
部 分 列 。 查 询 不 要 包括 Customer 表 的 CustomerID 列 ， 它 是 用 于 连接 两 
张 表 的 列 


技术 上 ， 查 询 应 该 包括 Sale Order 表 的 所 有 列 以 及 Customer 表 的 部 分 描述 性 列 。 为 了 保持 
可 更 新 性 ， 查 询 不 能 包括 Customer 表 的 主 码 (CustomerID ) 。 这 样 做 的 一 个 溢 在 的 缺点 是 无 论 
何 时 新 的 CustomerID 插 入 销售 记录 ， 表 单 必须 查询 数据 库 寻 找 匹 配 的 顾客 数据 。 结 果 是 ， 一 
些 表 单 系统 不 支持 这 种 操作 。 
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6.5.2 连接 表单 


解决 问题 的 另 一 个 方法 是 使 用 连接 表单 。 这 些 表单 可 分 别 显示 ， 或 者 可 能 分 成 几 部 分 显示 
在 一 张 表 单 中 。 后 一 种 方法 用 于 父 / 子 表单 ， 其 中 子 表单 包括 来 自 另 一 张 带 有 连接 到 父 表单 的 
一 对 多 关系 的 表 的 数据 。 结 果 是 ， 在 一 张 表单 中 显示 相关 的 表 相 对 在 独立 窗口 中 是 等 价 的 。 
主要 的 区 别 在 于 屏幕 空间 的 需求 不 同 。 如 果 把 几 个 分 区 放 在 一 张 表单 中 ， 用 户 会 需要 大 屏幕 
来 查看 所 有 的 数据 。 通 过 使 用 多 个 窗口 ， 用 户 无 法 同时 看 到 所 有 的 数据 ， 但 是 可 以 在 窗口 之 
间 切 换 ， 察 看 和 编辑 数据 。 

连接 表单 通过 查询 把 第 二 张 表 中 显示 的 数据 和 原 表单 的 码 值 匹 配 。 例 如， 在 主 Sale Order 
表单 中 ，CustomerID 可 以 用 于 显示 连接 表单 中 匹配 的 顾客 数据 。 类 似 地 ，SaleItem 子 表单 可 以 
显示 和 主 表单 中 SaleID 匹 配 的 行 。 每 个 相关 部 分 的 数据 可 以 在 分 开 的 表单 或 区 域 中 显示 。 理 想 
情况 下 ， 表 单 系统 有 办 法 自动 地 连接 并 检索 匹配 的 数据 ， 否 则 ， 必 须 定制 代码 来 改变 潜在 的 
查询 并 根据 需要 刷新 数据 。 


6.5.3 ”属性 和 控件 


大 部 分 现代 软件 包 使 用 面向 对 象 (00) 技术 。 在 面向 对 象 设计 中 ， 每 个 对 象 都 有 描述 它 
的 属性 和 它 能 够 执行 的 方法 或 函数 。 对 象 还 和 事件 驱动 系统 紧密 相关 ， 在 这 样 的 系统 中 ， 用 
户 的 行为 和 修改 可 以 触发 各 种 事件 。 大 部 分 数据 库 表 单 使 用 这 种 方法 。 但 是 ， 一 般 使 用 的 对 
象 已 经 由 DBMS 定 义 。 读 者 只 需 对 属性 赋值 ， 编 
写 简短 的 程序 响应 各 种 事件 ， 使 应 用 程序 方便 


用 户 即 可 。 基本 表 / 查 询 
过 滤器 


图 6-13 的 属性 列表 突出 显示 表单 和 控件 的 属 
性 可 以 分 为 几 类 。 第 一 类 (数据 ) 和 数据 源 相 
关 ， 在 这 里 可 以 设置 基本 表 和 查询 。 可 以 设置 
过 滤器 只 显示 满足 某 个 条 件 的 数据 行 。 还 可 以 
直接 指定 排列 顺序 ， 以 及 基本 查询 的 WHERE 子 
名 ， 这 常常 是 更 有 效 的 方法 。 这 一 步 实 际 上 把 
控件 元 素 和 数据 库 绑 定 在 一 起 。 

第 二 组 属性 指向 数据 完整 性 ， 帮 助 控制 纺 
辑 类 型 和 表单 允许 的 修改 。 例 如 ， 可 以 为 每 个 
用 户 设置 属性 ， 这 样 部 分 用 户 使 用 特殊 的 表单 
不 可 以 增加 或 删除 数据 。 但 是 ， 一 定 要 记 住 在 
SQL 中 设置 这 些 条 件 更 为 安全 ， 这 样 应 用 在 数 


S i S 图 6-13 表单 基本 属性 。 至 少 设置 数据 源 和 基本 
据 库 而 不 只 是 表单 。 例 如 ， 销 售 记录 员 不 能 增 格式 属性 。 附 加 的 属性 保证 一 致 性 ， 保 


加 新 的 供应 商 。 护 数据 和 表单 方便 使 用 
第 三 类 属性 控制 表单 的 显示 。 从 标题 到 滚 


动 条 ， 表 单 大 小 和 背景 ,设置 一 切 显示 属性 。 再 强调 一 遍 ， 记 住 一 致 性 非常 重要 。 在 开始 项 
目 之 前 ， 选 择 设计 模板 和 标准 ， 然 后 所 有 的 表单 和 控件 都 要 满足 标准 。 
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6.5.4 表单 上 的 控件 


表单 由 控件 构成 。 控 件 包括 表单 上 的 所 有 对 象 。 常 见 的 控件 包括 简单 的 文本 标签 ， 数 据 输 
入 的 文本 框 ， 选 项 按钮 ， 图 片 和 列表 框 。 更 复杂 的 控件 可 以 从 商业 软件 开发 商 那 里 买 到 。 图 6-14 
显示 大 部 分 系统 常用 的 控件 。 标 签 和 文本 框 使 用 频繁 。 












Businees 
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击 箭头 时 展开 ， 用 户 可 以 选择 某 一 项 


所 有 控件 的 一 不 共同 属性 是 名 字 。 每 个 控件 必须 有 名 字 。 注意， 名 字 一 旦 设置 ， 很 难 修改 。 
其 他 控件 和 程序 代码 使 用 该 名 字 ( 像 变 量 名 一 样 ) 在 表单 上 检索 和 存储 数据 。 创 建 控件 时 最 
好 选择 有 意义 的 名 字 。 如 果 以 后 试图 修改 ， 必 须 找 到 所 有 引用 这 个 控件 的 控件 和 程序 一 这 是 
一 件 耗 时 易 错 的 事 。 有 的 人 根据 控件 的 类 型 命名 。 例 如 ， 标 签 控 件 以 “lbl” 开 头 ， 如 
“lblAddress”。 这 种 命名 方式 对 于 以 后 阅读 代码 的 程序 员 大 有 帮助 。 

标签 控件 和 文本 框 

最 基本 的 控件 是 标签 、 文 本 框 和 命令 按钮 。 标 签 是 一 段 简单 的 文本 ， 用 户 不 能 直接 修改 。 
文本 框 用 于 显示 数据 库 的 数据 和 输入 新 值 。 在 表 中 检索 并 存储 数据 的 控件 叫做 绑 定 控件 ， 因 
为 任何 数据 的 改变 都 会 自动 地 保存 在 表 中 。 数 据 可 以 输入 非 绑 定 控件 ， 但 是 值 不 会 存储 在 数 
据 库 申 ， 并 且 在 用 户 浏览 表 的 各 个 数据 行 之 间 也 不 会 改变 。 标 签 和 文本 框 的 常见 属性 包括 颜 
色 、 字 体 和 大小。 绑 定 和 非 绑 定 框 的 区 别 在 于 绑 定 框 有 控件 源 ( 表 的 列 ) 。 在 非 绑 定 框 中 ， 这 
个 属性 是 空 的 。 

命令 按钮 

典型 的 命令 按钮 只 有 一 个 功能 : 当 用 户 点 击 时 ， 触 发 事件 (On_Click 事 件 )， 执 行 某 个 动 
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作 。 这 个 动作 有 几 种 选择 ， 包 括 打 开 另 一 个 表单 ， 打 印 报表 ， 或 者 运行 定制 程序 。 命 令 按钮 
是 导航 表单 的 主要 组 成 部 分 ， 用 于 打开 相关 表单 。 

复 选 框 和 单 选 按 铬 

这 些 控件 允许 用 户 从 一 组 选项 中 做 出 选择 。 例 如 ， 办 事 员 从 雄性 、 峻 性 和 未 知 中 指出 动物 
的 性 别 。 用 户 有 几 种 方法 做 出 选择 。 从 技术 上 ， 在 这 三 种 方法 中 没有 区 别 。 但 是 ， 对 于 常见 
的 用 户 界面 标准 ， 使 用 时 略 有 区 别 。 

本 质 上 有 两 种 选择 方法 : 互 尺 和 多 选 。 考 虑 动物 性 别 的 例子 。 三 个 选项 是 互 斥 的 。 一 个 动 
物 或 者 是 雄性 ， 或 者 是 肉 性 ， 或 者 不 清楚 性 别 情况 (中 性 是 独立 备 选 ， 并 不 影响 一 般 的 性 别 
决定 ) 。 单 选 按钮 组 ( 圆 型 ) 用 于 互 斥 选项 。 用 户 知道 ， 当 看 见 一 组 单 选 按钮 ， 只 选择 一 个 先 
项 。 另 一 方面 ， 顾 客 可 能 订购 具有 这 些 特 征 的 狗 : 注册 的 、 褐 色 或 黑色 、 其 至 脾气 暴 烈 的 和 
短 毛 的 。 这 种 情况 应 该 使 用 带 有 复 选 框 ( 方 型 ) 的 表单 ， 因 为 可 以 选中 几 个 选项 。 选 择 一 个 
选项 不 影响 其 他 选项 的 选择 。 

图 形 功 能 

有 时 候 希 望 在 表单 中 增加 图 形 。 有 的 控件 负责 图 形 ， 就 像 简 单 的 线 和 框 一 样 。 线 和 框 常常 
通过 增加 阴影 或 光照 的 方式 给 其 他 控件 建立 三 维 效果 。 

为 了 像 图 6-15 那 样 显示 表 中 的 图 像 ， 必 须 先 在 访 
表 中 定义 对 象 或 图 像 列 。 然 后 绑 定 对 象 框 和 文本 框 一 Pe 
样 在 表单 上 定位 和 显示 图 像 。 Name: Che Zhang 

为 了 使 用 图 像 或 纹理 作为 背景 ， 首 先 使 用 图 形 包 | Phone: 222-111-1524 
保证 图 像 足 够 明亮 不 会 影响 其 他 框 读 取 。 然 后 把 表单 “| Phote: 

的 图 形 属性 设置 为 图 像 文件 的 名 称 。 在 大 部 分 情况 下 ， 
希望 把 图 像 伐 入 表单 ， 所 以 图 片 直接 包含 在 数据 库 中 。 

组 合 框 和 列表 框 

列表 框 和 组 合 框 在 大 部 分 数据 库 应 用 程序 中 是 有 
用 的 控件 。 这 两 个 控件 的 目的 是 显示 列表 项 ， 允 许 用 
户 从 中 选择 一 个 值 。 组 合 框 和 列表 框 主要 有 两 点 区 别 。 
在 用 户 点 击 向 下 箭头 之 前 ， 组 合 框 只 显示 一 个 选择 项 。 
第 二 ， 用 户 可 以 直接 向 组 合 框 输入 值 (组 合 框 的 名 字 
表明 它 是 列表 框 和 文本 框 的 联合 ) 。 大 部 分 设计 者 青睐 “图 6-15 绑 定 在 数据 列 上 的 图 像 。 雇 员 的 
组 合 框 ， 因 为 它 占用 的 空间 比 列表 框 小 。 照片 扫描 并 存储 在 数据 库 列 中 

组 合 框 有 两 个 基本 用 途 。 第 一 是 向 表 中 插入 值 。 第 二 是 搜索 某 一 特定 数据 行 。 如 果 决 定 在 
应 用 程序 中 使 用 两 种 组 合 框 ， 应 该 用 颜色 或 其 他 属性 区 分 用 途 。 

如 果 观 察 规范 化 的 表 ， 会 发 现 为 什么 组 合 框 在 关系 数据 库 应 用 如 此 广泛 。 许 多 表 通 过 内 部 
生成 的 ID 连接 起 来 。 例 如 ，S$ale 表 用 CustomerID 识 别 顾客 。 在 图 6-12 中 ， 办 事 员 需 要 输入 值 17 
指明 购物 的 顾客 但 是 办 事 员 如 何 知道 这 个 值 呢 ? 不 可 能 期 望 员工 记 住 成 千 上 万 的 顾客 代码 。 
类 似 地 ， 也 不 能 要 求 顾客 记 住 他 们 的 ID 号 。 在 某 些 情况 下 (例如 音像 出 租 店 ) 可 以 要 求 顾客 
带 着 包含 该 信息 的 ID 卡 。 读 者 可 能 想到 使 用 某 个 共同 的 ID 号 ， 像 税 号 或 电话 号 码 。 但 是 很 难 
保证 这 些 号 码 的 惟一 性 ， 并 且 难 以 说 服 顾客 给 出 这 些 号 码 。 
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一 种 比较 好 的 解决 方案 是 让 数据 库 使 用 内 部 生成 的 ID ， 然 后 办 事 员 从 名 字 列 表 中 选 出 该 
顾客 。 因 此 ， 大 部 分 表单 开发 系统 支持 组 合 框 ( 有 了 时 叫做 选择 框 )。 组 合 框 显示 Customer 表 中 
所 有 的 顾客 条 目 ( 按 名 字 或 电话 号 码 排序 )。 输 入 顾客 名 字 的 前 几 个 字母 ， 组 合 框 就 会 滚动 找 
出 匹配 的 条 目 。 当 办 事 员 选 择 合适 的 顾客 ， 相 应 的 人 D 就 输入 了 Sale 表 。 

复杂 的 控件 

其 他 的 控件 对 象 可 以 使 用 多 种 计算 机 语言 创建 或 者 从 商业 公司 购买 。 

几 种 其 他 控件 如 图 6-16 所 示 。 标 签 和 日 历 控件 在 商业 应 用 程序 中 尤为 有 用 。 网 格 控件 可 以 
以 电子 表格 的 形式 显示 数据 。 这 些 类 型 的 控件 不 像 标准 绑 定 控件 那样 容易 使 用 。 开 发 者 需要 
写 简短 的 程序 向 控件 下 载 数据 和 响应 控件 事件 。 





图 6-16 附加 控件 。 有 成 千 上 万 的 控件 可 以 改善 用 户 界面 或 提供 专业 服务 。 常 
见 的 控件 包括 标签 、 网 格 、 日 历 、 进 度 条 、 滑 块 和 微调 框 。 读 者 也 可 
以 自己 创建 定制 控件 


图 表 

用 于 决策 的 数据 库 应 用 程序 经 常 包括 图 表 或 图 形 。 图 表 是 另 一 类 可 以 放 在 表单 (或 报表 ) 
上 的 控件 。 建 立 有 用 图 表 的 第 一 步 是 和 用 户 讨论 需要 什么 类 型 的 数据 和 什么 类 型 的 图 表 。 然 
后 通常 建立 新 的 SQL 查 询 ， 收 集 要 在 图 表 中 显示 的 数据 。 图 表 控 件 把 图 表 放 在 表单 上 ， 并 指定 
其 属性 (如 图 表 类 型 、 箭 头 刻度 和 颜色 )。 

在 数据 库 表 单 和 报表 中 ， 常 用 两 种 类 型 的 图 表 : (1) 显示 当前 显示 行 的 细节 图 ; (2) 显 
示 所 有 (或 部 分 ) 行 汇总 数据 的 图 。 这 两 类 图 表 的 区 别 在 于 显示 数据 的 级 别 。 细 节 图 随 着 每 
行 显示 数据 的 改变 而 改变 。 汇 总 图 通常 从 总 数 或 平均 值得 到 。 

图 6-17 列 出 两 种 类 型 的 图 ， 它 们 都 可 能 在 宠物 商店 中 用 到 。 每 幅 图 表 对 比 了 花 在 动物 和 商 
品 上 的 费用 。 但 是 ， 上 面 一 组 图 分 开 显 示 了 每 个 独立 销售 ,所 以 图 形 随 着 每 行 Sale 查 询 结果 的 
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不 同 而 不 同 。 下 面 的 图 显示 了 商店 的 所 有 销售 一 一 虽然 也 放 在 展示 每 行 数据 的 Sale 表 
它 不 会 改变 (除非 超时 )。 为 了 创建 两 种 类 型 的 图 表 ， E 本 
主要 的 区 别 在 于 查询 。 细 节 图 表 的 查询 包含 一 列 
(SaleID ) 连接 到 表单 中 显示 的 数据 行 (基于 SaledID ) 。 
汇总 图 表 计 算 所 有 销售 的 总 额 ， 没 有 连接 到 某 个 特定 
的 销售 。 


6.5.5 多 表单 


读者 可 能 想到 ， 一 个 应 用 程序 很 快 就 充满 大 量 的 
表单 。 当 然 ， 表 单 应 该 彼此 相连 ， 用 户 可 以 通过 点 击 
按钮 、 数 值 或 图 片 快速 地 在 表单 间 跳 转 。 导 航 表单 在 
把 表单 集成 在 一 块 起 了 重要 作用 。 但 是 ， 读 者 还 可 以 
直接 把 表单 连 起 来 。 最 常见 的 例子 是 把 子 表单 放 在 主 
表单 内 。 在 这 种 情况 下 ， 表 单 通过 设置 子 表单 的 


单 上 , 但 


dy En 





图 6-17 表单 或 报表 中 的 图 表 。 上 面 的 图 


Master 和 Child 属 性 连接 起 来 。 然 后 数据 库 系 统 保持 数 表 显 示 了 每 项 销售 的 对 比 ， 它 随 
据 的 同步 ， 当 用 户 选 择 主 表单 中 新 的 一 行 时 ， 子 表单 着 每 行 数 据 改变 。 下 面 的 图 显示 
自动 定位 和 显示 匹配 的 行 。 局 请 本 的 家 比 ， 不 相 基 行 二 十 


当 表 单 包括 相关 数据 时 ， 有 时 候 需 要 在 新 表单 中 打开 并 显示 相关 的 数据 行 。 例 如 ， 如 果 
Order 表 单 包括 顾客 数据 ， 当 用 户 点 击 Edit 按 钮 (或 者 双击 顾客 姓名 ) ， 应 用 程序 应 该 打开 
Customer 表 单 。 如 图 6-18 所 示 ，Customer 表 单 应 该 显示 和 Order 表 单 中 顾客 相应 的 数据 。 打 开 
表单 命令 使 用 连接 条 件 参 数 完成 这 一 工作 。 条 件 限制 在 新 表单 中 显示 的 数据 。 在 这 个 例子 中 ， 
连接 条 件 指 定 Customer 表 单 的 CustomerID 必 须 和 Sales 表 单 的 CustomerID 一 致 。 





图 6-18 连接 带 有 匹配 数据 的 表单 。 打 开 Customer 表 单 显 示 和 已 经 输入 到 Sale 
表单 的 顾客 相对 应 的 数据 


大 部 分 情况 下 ， 用 户 会 关闭 Customer 表 单 返回 主 Sale 表 单 。 但 是 ， 如 果 用 户 保持 两 个 表单 
同时 打开 该 怎么 办 ? 他 们 希望 两 个 表单 的 数据 同步 ， 这 样 ， 如 果 在 Sale 表 单 有 新 数据 显示 ， 
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Customer 表 单 相 匹配 的 数据 也 可 以 显示 。 需 要 写 几 行 代码 保证 这 种 同步 。 从 本 质 上 说 ， 当 Sale 
表单 改变 时 ， 代 码 获 得 新 的 CustomerID， 把 它 传 
递 给 Customer 表 单 ， 再 查询 数据 库 ， 然 后 用 匹配 
的 数据 刷新 表单 。 

图 6-19 显 示 相 关 情 况 。 当 顾客 查看 动物 数据 
时 ， 决 定 买 下 它 。 按 下 Animal 表 单 的 Purchase 按 
钮 可 以 迅速 转 到 Sale 表 单 。 用 按钮 把 AnimalID 复 
制 到 Sale 表 单 的 合适 位 置 是 很 方便 的 。 

同上 ， 这 里 也 需要 写 几 行 代 码 才 能 把 
AnimalID 插 入 到 Sale 表 单 的 合适 控件 中 。 在 某 
些 情况 下 ， 可 能 需要 Sale 表 单 把 ID 值 传 递 回 
Animal 表 。 

商业 应 用 程序 常常 需要 计算 子 表 单 的 部 分 和 。 
如 图 6-19 所 示 ， 有 的 系统 把 子 表单 完全 当 作 独立 
的 表单 ， 所 以 必须 先 计 算 子 表单 的 部 分 和 ， 然 后 图 6-19 从 另 一 个 表单 中 复制 数据 。 默 认 的 





把 值 复制 回 主 表单 。 AnimalID 从 Animal 表 复制 到 Sale 表 单 。 
同样 的 ， 子 表单 首先 计算 部 分 和 ， 然 
6.5.6 国际 属性 后 复制 到 主 表单 


设计 表单 和 报表 时 ， 需 要 越 来 越 多 地 考虑 应 用 程序 的 国际 化 设置 。 一 个 明显 的 因素 是 需要 
把 数据 翻译 成 不 同 的 语言 。 有 的 应 用 程序 开发 系统 通过 让 开发 者 在 一 个 位 置 存储 所 有 的 注释 
(例如 窗口 名 称 、 标 签 和 错误 信息 ) 的 办 法 来 解决 语言 问题 。 可 以 利用 DBMS 创 建 各 种 语言 能 
表 ， 保 存 需要 翻译 的 词汇 ， 达 到 同样 的 效果 。 然 后 构造 表单 时 根据 某 个 代码 值 查询 合适 的 词 
汇 。 这 个 独立 的 表 由 翻译 者 修改 一 不 需要 修改 表 
单 或 代码 。 这 样 做 的 缺点 是 没有 编译 器 ， 每 个 表单 | “语言 
下 载 时 间 更 长 ， 因 为 每 个 词汇 需要 分 别 从 表 中 查询 | “0 和 
得 到 。 

如 图 6-20 所 示 ， 另 一 个 和 语言 相关 的 问题 是 大 
部 分 语言 使 用 特殊 的 字符 集 。 例 如 ， 拉 丁 语言 经 党 








包括 重音 符 和 其 他 区 分 标记 。 东 方 语言 更 加 复杂 ， ee 
它们 需要 成 千 上 万 的 不 同 字符 图 ,而 不 是 少量 字母 。 eg 
计算 机 必须 能 够 显示 每 个 国家 的 特殊 字符 集 。 目 前 ， . 电话 号 三 
这 一 问题 流行 的 解决 方案 是 使 用 Unicode 系 统 ， 它 “分隔 符 
是 一 个 国际 标准 ， 存 储 和 显示 每 种 语言 的 字符 。 有 有 
的 操作 系统 支持 Unicode。 例 如 Windows 95、 . 国家 DD 号 码 


Windows NT、NetWare 和 部 分 UNIX 支 持 2 字 节 字符 。 
一 些 现代 应 用 程序 开发 工具 支持 Unicode;， 如 果 编 图 6-20 国际 属性 。 当 创建 在 国际 上 使 用 的 
写 需要 国际 支持 的 应 用 程序 ， 一 定 选择 能 够 提供 支 表单 和 报表 时 ， 认 真 考虑 字符 和 数 


据 的 不 同 格式 。 还 有 ， 遵 守 所 有 国 
持 的 工具 。 语 言 和 字符 的 问题 还 影响 数据 排序 。 家 的 法 律 一 尤其 是 数据 的 隐私 权 
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此 ， 数 据 库 允 许 根据 当前 字符 集 设置 排列 顺序 。 

日 期 、 时间 、 电 话 号 码 、 邮 政 编码 和 货币 等 数据 格式 也 随 着 国家 和 地 区 的 不 同 而 不 同 。 大 
部 分 可 以 在 Windows 环 境 〈 控 制 面板 ) 中 设置 。 但 是 ， 把 数据 从 一 个 国家 转换 到 另 一 个 国家 时 
一 定 要 小 心 。 日 期 和 时 间 的 转换 会 顺利 完成 ， 因 为 它们 以 与 基础 日 期 和 时 间 的 差 的 形式 存储 。 
但 是 ， 货 币 转换 会 出 问题 。 假 设 在 美国 的 数据 库 应 用 程序 中 有 一 列 内 容 是 货币 ， 其 值 以 美元 
记录 〈 例 如 18.20 美 元 ) 。 如 果 把 数据 库 复 制 到 使 用 英镑 作为 货币 标准 的 伦敦 的 机 器 上 会 发 生 什 
么 呢 ? 结果 是 货币 符号 会 改变 ， 而 数值 不 变 。 在 这 个 例子 中 ， 用 户 会 看 到 18.20 英 磅 ， 这 当然 
不 正确 (应 该 是 11.44 英 磅 )。 有 两 种 办 法 : (1) 不 管 货币 数据 类 型 ， 仍 然 使 用 美元 计价 ， 
(2) 编写 查询 把 所 有 的 货币 数据 转换 为 新 货币 。 通 过 定义 自己 的 货币 类 型 ， 第 一 种 情况 有 可 
能 使 用 的 货币 格式 ， 避 免 货币 符号 的 转换 。 第 二 种 方法 对 于 很 多 应 用 程序 可 能 是 最 好 的 ， 在 
查询 中 把 原始 值 乘 以 转换 因子 非常 方便 。 当 然 ， 转 换 因 子 随时 间 而 改变 ， 所 以 必须 注意 跟踪 
转换 日 期 。 

电话 号 码 和 邮政 编码 的 情况 更 为 复杂 。 当 定义 数据 和 创建 表单 时 ， 一 定 要 预 留 足够 的 空间 
保存 国家 代码 和 长 电话 号 码 。 还 要 记 住 有 的 国家 的 邮政 编码 不 仅 包 括 数 字 ， 还 有 字母 。 程 序 
员 习 惯性 地 认为 通过 把 邮政 编码 限制 为 5 位 数字 有 利于 减少 输入 数据 的 错误 。 在 国际 设置 中 ， 
不 能 做 这 种 假设 。 一 种 减少 数据 输入 错误 的 方法 是 使 用 组 合 框 ， 其 中 包括 一 张 邮政 编码 的 
(巨大 的 ) 表 。 更 可 人 靠 的 方法 是 购买 能 够 自动 根据 地 址 检查 和 更 新 数据 库 中 邮政 编码 的 软件 。 

最 后 ， 注 意 遵守 所 有 国家 的 关于 安全 和 数据 访问 法 律 。 例 如 ， 很 多 欧洲 国家 关于 隐私 权 的 
法 律 很 严格 一 一 尤其 关于 顾客 数据 和 国家 ID 号 码 。 在 有 些 情 况 下 ， 把 欧洲 收集 的 数据 转移 到 美 
国 是 非法 的 。 


6.6 直接 操作 图 形 对 象 


在 过 去 的 儿 年 内 ， 应 用 程序 的 用 户 界面 发 生 了 变化 。 图 形 的 大 量 使 用 导致 对 对 象 的 直接 操 
作 的 重视 。 用 户 可 以 在 屏幕 上 把 一 个 项 目 从 一 个 地 方 拖 到 另 一 个 地 方 以 示 更 改 ， 而 不 是 输入 
命令 。 大 部 分 人 已 经 看 到 这 种 方式 应 用 于 基本 的 操作 系统 命令 。 例 如 ， 在 DOS 时 代 ， 复 制 文 
件 必 须 输入 下 面 的 命令 ， COPY MYFILE.DOC A:MYFILE.DOC。 现 在 ， 点 击 该 文件 图 标 ， 然 
后 拖 到 一 个 磁盘 驱动 器 的 图 标 上 就 可 以 了 。 


6.6.1 - Sally 的 宠物 商店 示例 


图 形 方式 使 应 用 程序 更 容易 使 用 。 但 是 ， 它 需要 读者 改变 对 应 用 程序 的 思维 方式 ， 和 强烈 
的 创造 性 思维 。 考 虑 宠物 商店 的 例子 。 本 章 开始 时 设计 的 表单 容易 创建 ， 并 且 满 足 应 用 需求 。 
但 是 ， 需 要 改变 整个 应 用 程序 的 方法 。 . 

图 6-21 是 宠物 商店 例子 的 部 分 示意 图 。 比 较 这 张 表单 和 图 6-9 的 传统 数据 输入 表单 。 传 统 
的 方法 要 求 用 户 向 框 内 输入 文本 。 借 助 图 形 ， 用 户 可 以 看 见 各 种 动物 的 照片 ， 然 后 把 它们 拖 
到 顾客 ， 表 示 一 笔 交 易 。 双 击 一 个 项 目 会 提供 更 多 图 片 或 附加 说 明 。 类 似 的 方法 用 于 特别 订 
单 ， 使 用 拖 放 技 术 定 义 动物 〈 种 类 、 颜 色 等 )， 然 后 提交 订单 。 

用 户 不 可 能 完全 避免 数据 输入 。 有 的 地 方 必须 收集 用 户 的 基本 数据 (姓名 、 地 址 、 电 话 号 
码 等 )。 当 办 事 员 双 击 用 户 的 图 标 或 照片 时 ， 激 活 传统 表单 ， 然 后 输入 数据 。 也 就 是 说 ， 图 6-21 
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的 表单 代替 了 传统 的 销售 表单 而 不 是 代替 基本 顾客 表单 。 当 然 ， 一 旦 顾客 数据 存储 在 文件 中 ， 
就 可 以 在 任何 顾客 访问 的 时 候 拖 到 主 表 单 。 


A Sally 的 当前 选择 





图 6-21 直接 操作 完 物 商店 的 图 形 对 象 。 无 需 向 框 中 输入 AnimalID， 只 需 把 动 
物 的 图 片 拖 到 顾客 ， 就 可 以 形成 交易 。 双 击 某 个 项 目 显示 更 多 细节 或 
相关 图 片 


6.6.2 因特网 


对 于 图 形 和 对 象 的 直接 操作 的 重视 对 于 因特网 上 表单 的 应 用 极为 有 有 用。 首先 ， 大 部 分 用 户 
几乎 没有 操作 数据 库 的 经 验 ， 对 公司 也 知之 甚 少 。 创 建 公司 和 它 的 流程 的 图 形 模型 有 两 个 重 
要 目的 : (1) 由 于 和 用 户 已 知 的 实际 购买 方式 相 匹 配 ， 方 便 使 用 网 站 ， (2) 把 用 户 的 行为 限 
制 在 事先 定义 好 的 范围 内 。 

图 形 化 界面 的 一 个 目的 是 隐藏 数据 库 的 使 用 。 是 的 ， 所 有 的 基本 产品 信息 、 数 字 和 销售 数 
据 存储 在 数据 库 中 。 数 据 库 系 统 具 有 搜索 和 保存 用 户 选择 的 功能 。 它 还 可 以 为 管理 者 提供 报 
表 和 数据 分 析 。 但 是 ， 用 户 并 不 需要 了 解数 据 库 本 身 。 用 户 只 需 看 到 存储 和 产品 的 图 象 。 他 
们 操作 对 象 以 了 解 更 多 情况 ， 或 者 下 订单 。 使 用 因特网 的 一 个 困难 在 于 受到 用 户 浏览 器 功能 
的 限制 。 浏 览 器 可 以 处 理 大 部 分 简单 数据 项 控件 ， 但 是 对 于 拖 放 操作 的 支持 欠 佳 。 虽 然 如 此 ， 
图 形 搜索 方式 有 助 于 提高 表单 的 直观 性 和 可 用 性 。 


6.6.3 图 形 方式 的 复杂 性 和 局 限 性 


基于 图 形 对 象 直接 操作 表单 可 能 有 潜在 的 缺点 。 最 重要 的 是 对 输入 数据 无 能 为 力 。 例 如 ， 
无 法 期 望 码头 工人 使 用 拖 放 表单 的 办 法 记录 数 百 个 箱子 的 接收 。 条 码 扫描 仪 可 能 更 有 效 。 类 
似 地 ， 质 量 控制 技术 员 更 喜欢 简单 的 键盘 . (或 语音 ) 系统 ， 这 样 他 (或 者 她 ) 可 以 一 边 工作 
一 边 输 入 数据 。 

甚至 宠物 商店 销售 表单 使 用 拖 放 方式 也 存在 争议 。 考 虑 典型 的 大 型 宠物 商店 的 操作 。 考 虑 
几 十 个 顾客 推 着 装 满 商品 的 购物 车 来 到 收银 台 ， 会 发 生 什 么 。 如 果 收 银 员 必 须 使 用 拖 放 的 方 
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式 ， 收 款 的 过 程 就 会 极为 漫长 。 在 这 里 ， 条 码 扫 描 仪 又 一 次 可 以 加 速 工作 进程 。 另 一 方面 ， 
如 采取 消 收 银 员 ， 商 店 的 工作 可 以 改善 。 考 虑 如 果 购 物 者 使 用 商店 的 拖 放 网 站 来 选择 商品 ， 
取 货 ， 等 待 装 好 袋子 再 带 走 ， 商 店 该 如 何 运 作 ? 获取 数据 方式 的 不 同 取决 于 业务 操作 的 不 同 ， 
以 及 谁 来 使 用 系统 。 

图 形 操作 方式 的 另 一 个 缺点 是 每 个 应 用 程序 需要 数量 可 观 的 定制 编程 工作 。 传 统 的 方法 更 
为 直接 。 向 表单 输入 数据 的 常用 工具 包括 文本 框 、 组 合 框 和 子 表单 。 这 些 工具 可 以 用 于 任何 
应 用 程序 。 另 一 方面 ， 对 象 的 直接 操作 要 求 屏幕 上 有 独立 的 业务 对 象 ， 并 且 和 数据 相连 。 每 
一 个 用 户 操作 〈 双 击 和 拖 放 ) 必须 为 应 用 程序 专门 定制 。 以 后 ， 可 能 会 有 工具 辅助 编程。 但 
是 现在 ， 图 形 方式 比 其 他 方式 要 求 更 多 的 编程 工作 。 

构造 因特网 上 图 形 化 数据 库 应 用 程序 面临 类 似 的 困难 。 有 两 个 主要 限制 ， 传 输 速度 和 有 限 
的 软件 工具 。 除 此 以 外 ， 巨 额 的 资金 和 繁重 的 工作 是 网 络 的 间接 需要 。 一 些 行业 的 很 多 公司 
正在 寻找 解决 方案 。 


6.7 报表 


理解 了 表单 ， 那 么 报表 就 比较 简单 了 。 相 比 之 下 ， 表 单 和 报表 的 主要 区 别 在 于 报表 适合 打 
印 ， 而 表单 适合 屏幕 显示 。 还 有 两 点 不 同 : (1) 表单 用 于 收集 数据 ， (2) 报表 一 般 用 于 展示 
汇总 数据 。 因 此 ， 报 表 没 有 数据 收集 控件 。 但 是 ， 如 果 可 以 打印 表单 ， 为 什么 还 需要 报表 
呢 ? 报表 的 两 个 主要 优势 在 于 (1) 方便 地 控制 多 页 输出 〈 带 有 连续 的 页 层 和 页 码 ) ， (2) 可 
以 合并 细节 和 汇总 数据 。 第 5 章 举 例 说 明了 SQL 查询 如 何 通过 GROUP BY 子 名 产生 相对 复杂 的 
结果 。 尽 管 如 此 ， 简 单 的 SQL 查询 可 以 用 于 显示 数据 行 的 细节 或 者 汇总 数据 一 一 但 不 能 同时 显 
示 。 好 的 DBMS 报 表 生 成 器 还 提供 附加 的 输出 控件 ， 例 如 使 用 红色 打印 负 值 。 


6.7.1 报表 设计 


如 图 6-22 所 总 结 的， 设计 报表 的 过 程 有 几 个 问题 需要 注意 。 在 表单 的 开发 过 程 中 ， 读 者 和 
用 户 需要 决定 内 容 和 布局 。 还 需要 知道 典型 的 报表 大 小 (页 数 和 份 数 )， 还 有 打印 的 频率 。 因 
为 涉及 物理 的 操作 ， 打 印 报表 是 一 个 耗 时 的 过 程 。 一 份 几 十 页 的 报表 没有 问题 。 但 是 ， 如 果 
报表 有 几 百 页 、 上 千 份 ， 必 须 仔 细 计 划 。 首 先 ， 需 要 一 个 快速 的 、 耐 用 的 打印 机 。 还 需要 机 
器 和 人 力 来 集中 分 发 这 些 报 表 。 打 印 长 报表 时 通常 需要 安排 好 时 间 。 

纸 质 报表 面临 着 不 同 的 安全 挑战 。 纸 质 报表 需要 更 多 的 传统 安全 控制 ， 例 如 书面 分 发 清 
单 、 份 数 和 控制 数据 。 如 果 安 全 对 于 企业 是 一 个 重要 问题 ， 那 么 设计 报表 时 应 该 建立 这 些 控 
制 机 制 。 . 

在 设计 报表 时 ， 涉 及 一 些 实质 的 和 美学 方面 的 问题 。 页 面 大 小 ， 字 体 和 页 面 的 整体 设计 需 
要 确定 。 新 的 DBMS 报 表 生 成 器 相对 灵活 ， 这 样 有 利 有 弊 。 好 处 是 设计 者 可 以 有 效 地 控制 报表 。 
坏处 是 设计 者 需要 更 多 地 理解 设计 一 一 包括 术语 。 

美学 设计 和 完整 的 设计 问题 超出 本 书 的 范围 。 如 果 读 者 希望 认真 地 设计 ( 纸 质 报表 、 表 
单 或 者 网 页 ) ， 可 以 考虑 学 习 图 形 设计 课程 。 尽 管 如 此 ， 如 果 能 够 学 习 一 些 基 本 内 容 ， 会 有 所 
耕 助 。 


"安全 控制 

分 发 清单 
惟一 编号 

隐藏 /不 打印 数据 
安全 打印 机 


传输 限制 
。 打印 机 限制 打印 队列 控制 
。 报表 生成 周期 如 何 ? 。 输出 事项 
字体 
可 读 性 
大 小 
。 颜色 可 用 性 用 户 限 制 
OCR 需求 





图 6-22 报表 设计 的 基本 原则 。 和 用 户 一 起 确定 报表 的 内 容 与 布局 。 估 计 报 表 的 
大 小 与 打印 频率 。 确 定安 全 控制 。 为 了 用 户 的 可 读 性 检查 字体 和 大 小 


6.7.2 ”术语 


很 多 基本 的 词汇 来 源 于 排版 和 图 形 设 计 。 如 图 6-23 的 词汇 帮助 读者 理解 报表 生成 器 以 及 产 
生 优质 报表 。 第 一 步 选 择 页 面 设置 ， 包 括 页 面 大 小 、 打 印 方向 (横向 或 纵向 ) 和 页 边 距 。 装 
订 系 统 的 类 型 会 影响 页 边 距 ， 可 能 必须 预 留 额外 的 装订 距离 来 满足 装订 要 求 。 
页 面 设置 首页 (横向 ) 
。 横 向 或 纵向 
。 页 边 距 
。 装 订 线 (装订 距离) 
0 字体 


$ 衬 线 Ye New Roman) 
< 无 衬 线 (Arial) 


@72 
4 四 提 Vi (12 磅 ) 





颜色 分 离 的 矫正 标记 


图 6-23 基本 的 出 版 术语 。 理 解 基本 的 设计 术语 有 助 于 设计 优质 报表 以 及 与 出 
版 者 和 排版 者 交流 
下 一 步 是 选择 字体 和 字号 。 一 般 来 说 ， 有 衬 线 的 字体 容易 阅读 ， 但 是 无 衬 线 字 体 有 更 多 的 
空白 ,在 较 大 或 较 小 字号 的 情况 下 更 容易 阅读 。 除 了 封面 和 标题 ， 避 免 装饰 字体 。 为 保证 栏 
对 齐 ， 分 栏 数 通常 为 固定 宽度 值 。 特 殊 的 固定 宽度 字体 (例如 Courier) ， 其 所 有 字母 使 用 完全 
一 样 的 宽度 ， 特 别 适合 于 不 使 用 制 表 符 对 齐 的 非 数 字 栏 。 
字号 大 小 常用 磅 来 衡量 。 大 部 分 常见 的 打印 字号 在 10 到 12 磅 之 间 。 握 指 规则 有 效 地 指出 
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了 72 磅 的 大 写字 母 的 高 度 大 约 为 1 英寸。 一些 报表 系统 使 用 四 号 字 测 量 大 小 和 距离 。 一 个 四 号 
字 相 当 于 1/6 英 寸 ， 或 者 12 磅 的 高 度 。 

如 果 报 表 中 包括 图 形 和 图 像 ， 术 语 更 加 复杂 。 我 们 知道 ， 位 图 的 质量 由 原始 图 像 分 辩 率 和 
输出 设备 的 分 辩 率 来 决定 。 常 见 的 激光 打印 机 的 分 辩 率 为 每 英寸 600 点 (dpi) 。 打 字 机 的 典型 
分 辩 率 为 2 400dpi。 在 分 辩 率 为 600dpi 的 激光 打印 机 上 看 起 来 很 好 的 图 像 在 分 辨 率 为 2 400dpi 
的 打字 机 上 可 能 太 小 或 者 太 粗粮 。 

如 果 报 表 是 彩色 的 ， 会 遇 到 更 多 问题 。 特 别 地 ， 屏 幕 上 的 颜色 可 能 和 打印 机 的 不 同 。 类 似 
地 ， 使 用 彩色 路 墨 打印 的 报表 样本 可 能 和 提交 给 打字 机 的 看 上 去 完全 不 同 。Pantones 颜 色 标 准 
通过 为 许多 标准 颜色 设置 数字 来 缩小 这 类 问题 。 在 彩色 打印 中 遇 到 的 相关 问题 需要 对 所 有 报 
表 创建 颜色 分 离 予 以 解决 。 对 于 提交 给 打印 店 的 全 彩色 报表 ， 每 一 页 需要 四 个 相互 分 离 的 片 。 
三 原色 ， 即 青色 〈 蓝 色 )， 洋 红色 (红色 )、 黄 色 ， 以 及 关键 的 黑色 ， 合 起 来 记 为 CMYK。 在 
这 种 情况 下 ， 为 保证 颜色 能 够 准确 地 合成 ， 每 一 页 需要 高 分 辩 率 的 校准 标记 。 

设计 中 最 重要 的 因素 之 一 是 保持 报表 简单 和 优雅 。 例 如 ， 在 一 页 中 坚持 使 用 一 种 字体 和 一 
两 种 字号 。 使 用 大 量 的 空白 以 突出 栏 和 特征 。 最 重要 的 是 ， 由 于 设计 风格 不 断 变化 ， 从 报纸 
和 杂志 的 布局 中 获得 新 思想 和 模式 。 


6.7.3 基本 报表 类 型 


从 数据 格式 的 角度 看 ， 有 三 种 主要 的 报表 类 型 : 表格 、 分 组 或 部 分 和 、 标 签 。 数 据 类 型 和 
报表 的 用 途 决 定 了 选择 哪 一 种 。 

表格 报表 和 标签 报表 

表格 布局 如 图 6-24 所 示 ， 是 最 简单 的 报表 设计 。 它 基本 上 等 同 于 打印 数据 栏 ， 类 似 于 输出 
查询 结果 。 和 简单 查询 相 比 ， 表 格 报表 的 优势 在 于 可 以 在 每 页 上 打印 页 眉 和 页 码 。 还 增加 了 
关于 字号 和 列 宽 的 控制 。 表 格 报 表 经 常用 于 列 出 详细 信息 ， 例 如 库存 清单 报表 。 注 意 排 列 顺 
序 十 分 关键 ， 因 为 这 些 报表 将 用 于 搜索 指定 项 目 。 





1 
2 
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4 
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6 
7 
8 
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EY 





图 6-24 表格 报表 布局 。 表 格 报表 功能 有 限 ， 但 是 适用 于 列举 细节 数据 。 它 们 
用 于 列 出 数据 明细 单 


如 图 6-25 所 示 ， 标 签 也 很 简单 。 标 签 报表 的 本 质 在 于 所 有 关于 一 行 数据 的 输出 打印 在 一 页 
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的 一 “ 列 ” 中 。 下 一 行 打 印 在 下 一 列 。 标 签 标 单 的 名 称 来 源 于 标签 的 预 印 或 预制 页 。 这 些 报表 
有 时 根据 实际 列 的 编号 命名 。 图 6-25 的 例子 中 ， 一 页 有 三 个 标签 ， 所 以 它 是 三 栏 报 表 。 在 出 现 
报表 生成 器 之 前 ， 打 印 标签 报表 富有 挑战 性 ， 因 为 打印 机 只 能 在 页 的 顶端 工作 。 因 此 ， 必 须 写 
程序 代码 控制 打印 三 个 不 同行 的 数据 ， 然 后 返回 并 打印 第 二 行 ， 如 此 反复 。 现 在 打印 机 更 加 灵 
活 ， 报 表 生 成 器 简化 了 工作 。 记 住 标签 报表 还 有 助 于 完成 其 他 工作 一 一 无 论 何 时 ， 需 要 按 行 把 
数据 排列 到 同一 页 的 不 同位 置 。 例 如 ， 通 过 插入 空白 行 和 改变 标签 大 小 ， 可 以 创建 tic-tac-toe 
数据 模式 。 它 可 以 对 封面 或 广告 单产 生 有 趣 的 作用 ， 但 是 不 要 对 数 百 页 数据 使 用 这 种 模式 。 
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图 6-25 标签 表单 布局 。 这 个 三 栏 报表 常用 于 打印 标签 页 ， 它 可 以 用 于 少量 需 
要 打印 在 一 页 上 的 数据 
分 组 或 部 分 和 
最 常见 的 报表 类 型 是 基于 分 组 和 计算 部 分 和 。 它 还 提供 最 灵活 的 报表 项 目的 格式 。 常 见 的 
例子 包括 打印 收据 或 账单 。 很 多 情况 下 ， 报 表 需 要 打印 多 行 数据 ， 如 图 6-26 所 示 的 订单 表单 。 
每 个 月 的 订单 打印 在 一 份 报表 中 ， 但 是 项 目 分 组 显示 每 个 独立 订单 的 部 分 和 。 很 多 人 把 这 样 
的 报表 作为 控制 中 断 报表 。 


2 列 
2 分 组 列 


OS-NMaro# FHopkins 


$2465 -Aqusrium Fiter &Pump $3500 ”Fish 19 .20 
$442 FleaCdierDogMedium $700 Dog 919.36 
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图 6-26 分 组 或 部 分 和 报表 。 打 印 多 个 订单 。 每 个 订单 有 一 个 详细 的 订购 项 列 
表 。 报 表 可 以 计算 每 个 订单 的 部 分 和 ， 以 及 整个 订单 的 总 和 


部 分 和 报表 的 关键 在 于 它 包 括 细节 项 列表 〈 订 购 项 、 数 量 、 费 用 等 ) ， 以 及 分 组 或 总 数 
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(订购 日 期 、 顾 客 和 订购 总 数 ) 。 为 了 创建 这 样 的 报表 ， 首 先 创建 包括 需要 显示 数据 的 查询 。 
在 这 个 例子 中 ， 可 能 包括 Order、OrderItem、Merchandise、Customer、Employee 和 Supplier 表 。 
注意 : 如 果 想 得 到 细节 数据 ， 不 要 在 查询 中 使 用 GROUP BY 语句 。 如 果 从 这 个 巨大 的 查询 中 
查找 数据 ， 将 得 到 大 量 的 行 和 列 一 一 带 有 很 多 重复 数据 。 这 样 做 固然 得 到 了 细节 ， 但 正好 是 用 
户 不 希望 看 到 的 。 报 表 的 目的 是 清理 显示 的 数据 。 

为 了 创建 分 组 报表 ， 请 看 图 6-27 所 示 的 报表 设计 。 这 个 格式 页 显示 了 数据 的 分 组 中 断 ， 并 
且 规 定 了 该 页 中 每 个 元 素 的 格式 。 这 里 的 格式 又 一 次 由 独立 的 控件 确定 。 更 改 控件 的 属性 可 
以 修改 该 控件 显示 数据 的 外 观 。 例 如 ， 可 以 设置 基本 的 字体 和 字号 属性 。 


“报表 标题 
< 页 丑 rae 


MerchandiseOrder | 
A 


2 分 组 标题 1 
4 分 组 标题 2 





+ 详细 内 容 











4 分 组 尾 注 2 
2 分 组 尾 注 1 
9 页 脚 
2 报表 尾 注 








图 6-27 分 组 报表 的 布局 。 基 本 的 报表 元 素 (报表 标题 等 ) 。 还 要 注意 页 面 布局 
由 数据 控件 的 位 置 和 属性 确定 。 在 Merchandise Order 的 同一 份 报表 中 ， 
只 定义 了 一 个 分 组 (根据 Order 号 ) 


报表 的 基本 元 素 是 页 届 、 页 脚 、 分 组 中 断 和 详细 内 容 。 报 表 标 题 包含 仅 在 报表 开头 显示 的 
数据 ， 例 如 封面 页 。 类 似 地 ， 报 表 尾 注 (report footer) 显示 报表 最 末 的 数据 ， 例 如 ， 汇 总统 
计数 据 或 图 表 。 页 届 和 页 脚 在 每 页 上 显示 ， 报 表 标 题 和 尾 注 页 除外 。 页 眉 和 页 脚 可 以 显示 列 
标题 、 页 码 、 公 司 标识 或 安全 标识 。 

定义 这 种 类 型 报表 的 报表 特征 是 分 组 。 图 6-27 的 例子 定义 了 一 个 分 组 : Merchandise- 
Order.PO Number。 报 表 会 为 查询 中 的 每 个 PONumber 中 断 或 创建 新 的 数据 组 。 每 个 Order 包 含 
很 多 订购 项 。 报 表 设 计 规定 这 些 行 按 照 ItemID 号 排序 (在 每 张 订单 内 部 )。 每 个 分 组 有 分 组 标 
题 和 分 组 尾 注 。 分 组 标题 显示 整个 订单 的 相关 数据 例如， 日期、 顾客、 店员 和 供应 商 )。 它 
还 包括 详细 内 容 (重复 ) 部 分 的 列 标签 。 分 组 尾 注 显 示 每 个 分 组 的 部 分 和 。 

每 个 报表 元 素 的 常见 用 法 如 图 6-28 所 示 。 所 有 的 元 素 (除了 详细 内 容 ) 可 以 成 对 出 现 一 一 
页 由 和 页 脚 。 并 不 一 定 要 一 起 使 用 。 例 如 ， 可 以 选择 在 页 眉 中 显示 页 码 ， 同 时 删除 页 脚 以 获 
得 更 多 页 面 空间 。 

分 组 代表 一 对 多 关系 。 例 如 ， 每 个 订单 的 详细 部 分 有 很 多 项 。 如 果 数 据 中 有 多 个 一 对 多 
(或 多 对 多 ) 关系 ， 可 能 需要 使 用 多 级 分 组 。 如 图 6-29 所 示 ， 每 个 分 组 嵌 套 在 另 一 个 分 组 内 部 ， 
详细 部 分 在 最 内 层 。 


报表 标题 整个 报表 只 显示 一 次 的 标题 页 


每 页 顶端 显示 的 标题 行 或 页 说 明 


分 组 标题 分 组 (例如 订单 ) 数据 和 详细 部 分 标题 


在 每 页 底部 显示 一 一 页 汇总 或 页 码 和 注释 


报表 最 末 显 示 一 次 
总 结 性 注释 、 总 和 、 整 个 数据 集合 的 图 表 





图 6-28 报表 布局 元 素 的 常见 用 法 。 大 部 分 元 素 可 以 成 对 使 用 ,但 是 可 以 去 掉 








任何 不 需要 的 元 素 
9 在 一 对 多 关系 中 经 常 使 Customer(C#, Name, ...) 
用 分 组 /中 断 
0 使 用 查询 连接 所 有 Order(O#, C#, Odate, ...) 
必须 的 表 Orderltem(O#, ltem#, Qty, 
可 以 包括 所 有 的 列 a 4 委 ; | 
4 使 用 查询 创建 通过 计算 得 国 | Group1: Customer 
到 的 列 (例如 ，Extended: H1: Customer name, address, . 
Price*Quentity) ; ; 
查询 中 避免 使 用 聚集 函 
或 求 部 分 和 


0 每 个 一 对 多 关系 变 成 新 的 子 分 组 


， F1: Customer total orders: 


图 6-29 嵌 套 分 组 。 例 如 ， 每 个 顾客 可 以 下 多 个 订单 ， 并 且 每 个 订单 可 以 包括 
多 个 内 容 行 。 使 用 两 个 分 组 : (1) 显示 每 个 顾客 的 订单 总 数 ， (2) 显 
示 每 个 订单 的 总 价值 
为 了 创建 这 份 报 表 ， 必 须 建 立 包括 每 个 显示 项 的 查询 。 从 详细 内 容 开 始 ， 然 后 加 入 其 他 的 
表 , 直到 包括 所 有 需要 的 列 。 可 以 使 用 通过 计算 得 到 的 列 以 减少 计算 量 ， 例 如 Price * Quantity。 
应 小 心 避免 使 用 聚集 函数 (例如 Sum) ， 避 免 使 用 GROUP BY 语句 。 惟 一 可 能 包括 这 两 个 功能 
的 原因 是 “详细 内 容 ” 行 ， 实 际 上 就 是 部 分 和 (或 平均 值 ) 本 身 。 
分 组 报表 常用 于 计算 ， 尤 其 是 部 分 和 。 一 般 来 说 ， 对 一 行 数据 的 计算 由 查询 负责 。 另 一 方 
面 ， 京 集 函 数 (Sum、Average 等 ) 由 报表 生成 器 控制 。 报 表 生 成 器 有 多 种 定义 操作 范围 的 方 
法 ， 也 就 是 ， 哪 些 数据 应 该 包括 在 总 数 之 中 。 


6.7.4 图 表 
报表 中 的 图 表 和 表单 中 的 类 似 。 第 一 步 是 决定 对 用 户 来 说 什么 类 型 的 图 表 最 能 够 表现 数 
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据 。 第 二 步 是 决定 图 表 应 该 放置 在 报表 的 哪个 元 素 中 。 如 果 对 详细 项 绘制 图 表 ， 那 么 图 表 应 
该 在 详细 内 容 部 分 ， 在 这 里 的 每 行 数据 都 将 重复 绘制 图 表 。 如 果 图 表 是 总 结 性 的 ， 它 属于 分 
组 尾 注 ， 或 者 如 果 汇 总 整个 报表 的 数据 ， 则 其 可 能 位 于 报表 尾 注 。 

一 旦 已 经 决定 图 表 的 类 型 和 位 置 ， 就 可 以 构造 查询 收集 数据 了 。 这 个 查询 和 产生 整个 报表 
的 查询 不 同 。 特 别 地 ， 如 果 是 分 组 尾 注 的 图 表 ， 为 了 得 到 图 表 可 能 需要 在 查询 中 使 用 聚集 函 
数 。 报 表 中 一 定 要 包括 把 图 表 和 数据 连接 起 来 的 列 一 一 即使 该 列 并 不 在 图 表 中 显示 。 图 6-30 显 
示 了 宠物 商店 的 销售 报表 中 的 一 条 销售 记录 。 图 表 中 的 总 数 由 独立 的 查询 计算 。 


Sales Report 


Sale BM 412004 Custormer 18 
(414) 331-5679 
David Lawence 
9326 Halltow Road 53916 
Name Breed Bom Gender i dd Color ListPrice SaiePrice 


8 Miranda Dog Norfolk Terrer 5/4/2004 Female AKC Red $203.75 $183.38 


天 ListPrice SalePrice Exterided 
Mer. 


hemdise 
1 Dog DogKennel-Small 1 $45.00 $16.00 $16.00 
36 Dog Leash 1 $22.00 $19.80 $19.60 


Sale Split 
pp \ OMerchandise 
Animal 


图 6-30 销售 报表 的 图 表示 例 。 它 突出 了 动物 和 商品 的 销售 量 的 比例 。 该 图 表 
和 Sale 表 出 现在 同一 个 层次 上 ， 而 不 是 在 Animal 或 Merchandise 的 详细 
部 分 ， 也 不 是 在 报表 尾 注 中 


6.8 应 用 软件 的 功能 


现代 应 用 软件 包括 多 个 功能 ， 具 有 标准 化 的 外 观 ， 简 化 读者 对 应 用 软件 的 使 用 。 最 重要 的 
三 个 功能 是 : 菜单 、 工 具 栏 和 帮助 系统 。 

菜单 是 显示 在 应 用 软件 顶部 的 一 组 功能 。 主 菜单 在 整个 应 用 中 保持 不 变 。 因 此 ， 菜 单 集中 
了 任何 时 刻 可 以 激活 的 功能 。 菜 单 对 具有 视觉 障碍 的 人 和 那些 喜欢 使 用 键盘 而 不 是 指示 设备 
(鼠标 ) 的 人 有 益 ， 因 为 功能 可 以 通过 键盘 激活 。 

工具 栏 包括 一 组 执行 常见 任务 的 图 标 或 按钮 。 有 的 应 用 软件 允许 用 户 使 用 特定 的 按钮 定制 
工具 栏 ， 通常 用 户 还 可 以 重新 设置 工具 栏 。 当 前 的 开发 工具 利用 这 个 功能 允许 用 户 把 菜单 放 
在 定制 工具 栏 中 。 





种 三 部 分 应 用 





帮助 系统 对 于 任何 应 用 软件 都 是 关键 部 件 。 在 大 部 分 应 用 软件 中 ， 它 代替 了 纸 质 手册 。 理 
论 上 ， 应 用 软件 应 该 在 没有 手册 的 情况 下 也 清晰 易 用 。 帮 助 系统 还 提供 额外 的 文本 或 图 片 指 
导 以 及 详细 信息 。 


6.8.1 菜单 和 工具 栏 


菜单 是 一 系列 选项 ， 当 用 户 选 中 时 做 出 某 种 动作 。 大 部 分 菜单 是 有 层次 结构 的 , 也 就 是 说 ， 
细节 选项 位 于 几 个 关键 词 之 下 。Windows 界 面 标 
准 规定 菜单 显示 在 应 用 软件 的 顶部 。 但 是 ， 用 户 
可 以 把 菜单 移动 到 另 一 个 位 置 。 大 部 分 应 用 程序 
使 用 相似 的 菜单 命令 。 例 如 ， 如 图 6-31 所 示 ， 主 
菜单 包括 了 三 个 典型 的 常见 命令 : 文件 、 编 辑 和 性 Gtomen solos ord Bentals 
帮助 。 文 件 命令 一 般 包 括 新 建 、 打 开 、 保 存 和 关 者 ”Customer 5ales 
闭 命令 。 读 者 的 应 用 程序 应 尽量 与 这 些 标准 保持 加 Customer 5al 
一 致 。 使 用 同样 的 布局 和 词语 构造 应 用 程序 ， 用 





图 6-31 菜单 示例 。 层 次 结构 。 加 下 划 线 的 字 


户 只 需 最 少 的 培训 就 可 以 理解 它 。 母 是 加 速 健 ， 可 以 通过 键盘 激活 。 还 
菜单 的 功能 可 以 增加 快捷 键 ( 例 如 ，Ctrli+D)， 在 
读者 可 能 希望 在 自己 的 应 用 程序 中 使 用 基本 OO 


DBMS 菜 单 。 这 样 ， 用 户 可 以 完全 控制 数据 库 。 尽 管 如 此 ， 在 大 部 分 情况 下 ， 读 者 最 好 为 自己 
的 应 用 程序 定制 菜单 .定制 的 菜单 有 这 样 一 些 好 处 。 首 先 ， 它 可 以 限制 用 户 操作 。 例 如 ， 如 
果 用 户 不 需要 删除 数据 ， 那 么 菜单 不 需要 删除 命令 。 还 可 以 设置 适当 的 安全 条 件 以 阻止 用 户 
通过 其 他 途径 删除 数据 。 从 菜单 中 删除 命令 有 助 于 限制 用 户 的 操作 。 定制 菜单 的 另 一 个 好 处 
是 简化 用 户 界面 。 如 果 用 户 只 需要 输入 四 五 个 命令 ， 那 么 在 菜单 中 仅 显示 这 些 选项 。 这 样 用 
户 会 更 快 地 找到 它们 。 第 三 ， 可 以 在 定制 菜单 中 加 入 特殊 的 功能 。 例 如 ， 可 以 增加 特殊 的 帮 
助 命令 向 支持 部 门 发 送 电子 邮件 。 第 四 ， 菜 单 选项 可 以 通过 键盘 激活 。 因 此 ， 依 靠 触觉 的 打 
字 员 和 有 视觉 障碍 的 用 户 可 以 不 看 屏幕 操作 应 用 
软件 。 

工具 栏 

定制 菜单 通常 在 工具 栏 上 实现 。 工 具 栏 通常 
包括 一 组 按钮 和 菜单 项 。 当 用 户 点 击 工具 栏 按钮 
时 ， 执 行 预定 义 的 操作 。 工 具 栏 可 以 包括 传统 的 
按钮 ， 还 可 以 包括 文 未 菜单 。 大 部 分 工具 栏 是 可 
停靠 的 ， 即 用 户 可 以 把 它们 拖 搜 到 应 用 软件 窗口 
的 任何 位 置 。 打印 报表 

设置 工具 栏 的 目的 是 通过 单 击 操作 访问 复杂 RN 
的 功能 或 经 常 使 用 的 命令 。 例 如 ， 很 多 工具 栏 有 ”图 6.32 工具 栏 示例 。 工 具 栏 可 以 包括 按钮 和 
一 个 快速 保存 当前 工作 的 图 标 。 如 图 6-32 所 示 ， 菜单 。 按 钮 通常 显示 图 标 。 当 指针 移 
可 以 在 工具 栏 上 设置 任何 图 标 和 命令 。 可 以 为 每 动 和 4 和 的 上 省; 是 孙策 过 这 吕 阳 全 


简单 提示 信息 。 当 点 击 按钮 时 ， 执 行 
个 窗口 设置 不 同 的 工具 栏 和 菜单 。 甚 至 可 以 有 多 某 个 动作 或 显示 菜单 
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个 工具 栏 。 例 如 ， 一 个 工具 栏 包括 访问 整个 应 用 软件 的 命令 。 特 殊 的 工具 栏 可 以 在 打开 每 个 
窗口 时 自动 添加 。 

创建 菜单 和 工具 栏 

为 了 支持 标准 化 和 简化 菜单 的 创建 ， 大 部 分 应 用 程序 开发 环境 有 菜单 生成 功能 。 具 体 的 步 
又 依 使 用 的 系统 而 不 同 ， 但 是 创建 莱 单 有 三 个 基本 步骤 : (1) 选择 布局 或 结构 ， (2) 给 出 每 
个 功能 的 名 称 和 访问 键 ， (3) 定义 选中 每 个 选项 时 的 操作 。 

创建 工具 栏 的 步骤 基本 类 似 : (1) 确定 每 个 窗口 需要 显示 的 工具 ， (2) 选择 或 者 创建 图 
标 代表 相关 命令 ， (3) 定义 选中 时 的 动作 。 创 建 工 具 栏 的 一 个 关键 步骤 是 选择 功能 的 图 标 。 
不 要 假定 用 户 可 以 识别 图 标 或 理解 它 的 含义 。 大 部 分 系统 允许 为 每 个 功能 定义 提示 信息 。 当 
用 户 把 鼠标 放 在 图 标 上 ， 就 显示 提示 信息 或 简要 的 注释 。 每 个 工具 栏 按钮 都 要 有 提示 信息 。 

在 当前 的 应 用 程序 开发 系统 中 ， 创 建 工具 栏 和 菜单 非常 简单 。 可 以 对 已 经 存在 的 工具 栏 ， 
增加 或 删除 某 些 功能 。 类 似 地 ， 可 以 创建 新 的 工具 栏 。 按 钮 图 标 和 菜单 可 以 拖 搜 到 工具 栏 上 。 

主要 的 步骤 是 设置 每 个 项 目的 属性 。 菜 单 名 称 应 该 简短 是 具有 描述 性 。 还 要 遵循 标准 的 商 
业 软 件 命名 规范 。 为 了 指定 访问 键 ， 在 字母 前 面 加 上 &。 例 如 ，&File 文 本 显示 为 File，Alt+F 可 
以 激活 相应 功能 。 快 捷 键 (例如 ，CtritD) 可 以 通过 适当 设置 详细 菜单 项 或 按钮 命令 来 实现 。 

大 部 分 系统 允许 创建 多 个 工具 栏 ， 并 且 根 据 不 同 的 用 户 或 应 用 软件 的 不 同 部 分 激活 或 阻止 
工具 栏 。 一 般 ， 需 要 创建 多 行 代码 激活 或 阻止 某 个 工具 栏 。 


6.8.2 定制 帮助 


在 线 帮 助 系统 不 断 发 展 ， 已 经 代替 了 质 纸 手 册 。 目 的 是 提供 用 户 有 效 使 用 应 用 软件 系统 可 
能 需要 的 背景 信息 和 特殊 指导 。 帮 助 文件 可 能 包括 文本 描述 、 图 片 和 连接 相关 主题 的 超 链 接 。 
帮助 信息 应 该 尽量 上 下 文 相 关 。 用 户 可 以 得 到 当前 特定 工作 所 需 的 信息 。 帮 助 系统 还 必须 有 具 
有 广泛 的 搜索 引擎 ， 方 便 用 户 找到 任何 主题 。 图 6-33 是 一 个 帮助 系统 的 例子 。 

为 了 保持 一 致 性 ，Windows 帮 助 系 统 儿 乎 自动 显示 文件 、 管 理 链接 、 表 的 内 容 ， 索 引 和 搜 
索 。 对 于 开发 者 ， 可 以 集中 精力 创建 包括 基本 信息 和 必要 链接 的 文件 。 然 后 帮助 系统 编译 器 
把 这 些 数 据 转化 为 Windows 帮 助 系统 可 以 显示 和 搜索 的 特殊 文件 。 一 旦 学 习 了 创建 页 的 基本 知 
识 ， 困 难 的 部 分 在 于 书写 完整 的 帮助 系统 所 需 的 上 百 页 的 文件 。 大 部 分 大 的 开发 项 目 主管 会 
雇用 人 员 专 职 写 帮助 文件 。 

创建 Windows 的 帮助 文件 

创建 帮助 文件 的 第 一 步 也 是 最 重要 的 一 步 是 理解 用 户 需 要 什么 信息 。 然 后 必须 写 出 个 性 化 
的 文件 解释 系统 的 目的 以 及 如 何 使 用 它 。 正 如 其 他 交互 工程 ， 首 先 必须 理解 用 户 。 哪 些 类 型 
的 人 会 使 用 这 个 软件 ?他 们 的 阅读 水 平 如 何 ? 他们 一 般 具 有 多 少 使 用 计算 机 的 经 验 和 训练 ? 
他 们 理解 商务 运作 吗 ? 目的 是 以 用 户 可 以 迅速 理解 的 形式 提供 简明 的 帮助 信息 。 

理解 用 户 的 需求 之 后 ， 应 该 书写 个 性 化 的 帮助 文件 。 创 建 帮助 系统 需要 五 个 基本 部 分 : 
(1) 文本 信息 ，(2) 图 像 ， (3) 主题 之 间 的 超 链 接 ， (4) 描述 每 页 的 关键 词 ，(5) 主题 
名 称 和 页 码 。 

从 Windows98 开 始 ， 微 软 修改 了 内 置 帮 助 系 统 。 旧 的 系统 仍然 存在 ， 但 是 对 于 新 的 系统 使 
用 超 文本 标记 语言 (HTML) 创建 帮助 文件 更 加 容易 。 有 很 多 创建 网 页 的 优秀 工具 。 但 是 ， 注 
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意 这 些 工具 : 有 的 ， 比 如 Word， 创 建 的 复杂 代码 可 能 和 帮助 系统 编译 器 不 相 容 。 使 用 HTML 
编辑 器 生成 基本 的 HTML 代 码 ， 不 要 使 用 XML 或 Javascript。 





Introduction to Sally's Pet Store 


世 D0, Salys Pet Store is a sample database 

2 ”prolectfor use with the Database 小 
2 GY Management Systems text book by Jerry | 

和 uty Post. The databaseis designedto be a work 3 

pt SS” inprogressto highlight specific elements | 





The Pet Store 


e jntroduction to the Fimmn 
® Processes 


Database Design 


® Comments on Database Structure 
. r 


Entering and Viewing Data 


图 6-33 帮助 窗口 示例 。Windows 帮 助 系统 管理 所 有 的 显示 和 搜索 。 读 者 只 需 
要 写 HTML 主 题 页 和 指定 关键 词 

从 设计 的 角度 讲 ， 首 先 设计 帮助 系统 的 风格 并 且 使 用 层 合 样式 表 定义 风格 至 关 重要 。 样 式 
表 设 置 字体 、 字 号 、 颜 色 和 页 边 距 。 样 式 表 的 功能 是 在 一 个 地 方 定义 所 有 的 布局 选项 。 每 个 
链接 到 样式 表 的 页 采用 其 定义 的 风格 。 所 以 ， 当 修改 整个 帮助 文件 的 布局 时 ， 只 需 对 样式 表 
作 少 量 修改 ， 所 有 的 页 都 会 使 用 新 的 风格 。 

每 个 主题 创建 为 独立 的 HTML 页 。 用 户 一 次 查看 一 页 材料 。 尽 量 保持 主题 简短 ， 可 以 在 一 
屏 内 显示 。 每 个 帮助 页 包括 指向 其 他 主题 的 链接 。 图 6-34 展 示 了 基本 帮助 主题 的 一 部 分 。 每 页 
应 该 有 标题 (以 <TITLE> 标 记 ) 。 页 通常 包含 指向 其 他 主题 的 链接 (使 用 HTML 标 准 标记 <A 
HREF>)。 图 像 可 以 是 两 种 格式 : JPEG 和 GIF 之 一 。 大 部 分 帮助 图 像 是 黑白 的 ， 应 采用 GIF 格 
式 。 大 部 分 图 形 包 可 以 以 这 些 格式 创建 和 保存 文件 。 当 保存 文件 时 ， 文 件 名 仅 包 括 字 母 和 数 
字 一 一 不 要 包括 空格 。 因 为 最 后 会 有 数 百 页 文件 ， 保 持 每 页 具有 简单 的 描述 主题 ， 并 且 在 最 后 
修改 是 一 个 好 的 办 法 。 

关键 词 是 每 个 帮助 页 的 重要 部 分 。 它 们 用 于 为 用 户 创建 索引 。 索 引 按照 字母 顺序 列 出 关键 
词 ， 当 用 户 双击 某 个 单词 时 ， 显 示 相 关 的 帮助 页 。HTML 帮 助 系统 工作 组 提供 两 种 创建 索引 的 
方式 : (1) 手工 列 出 每 个 词 和 相应 的 主题 ， (2) 在 主题 页 上 列 出 每 个 关键 词 。 第 2 种 方法 更 
容易 ， 也 不 容易 出 错 ， 但 是 它 把 关键 词 分 散 到 整个 文档 中 ， 很 难 把 它们 作为 一 组 编辑 。 帮 助 
系统 工作 组 有 工具 可 以 把 关键 词 放 在 一 个 主题 页 中 (编辑 /编译 器 信息 /关键 词 )。 但 是 必须 把 
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每 页 下 载 到 工作 组 才能 使 用 这 种 方法 。 相 反 ， 在 图 6-34 中 ， 复 制 <OBJECT> 的 所 有 内 容 和 
</OBJECT> 标 签 更 容易 ， 然 后 修改 每 页 列表 中 的 关键 词 。 每 个 关键 词 列 在 单独 的 <PARAM> 标 
签 之 中 。 如 果 想 得 到 多 个 层次 ， 可 以 使 用 有 逗号 列 出 层次 。 例 如 ， 三 个 条 目 : (1) 销售 ， (2) 
销售 ， 商 品 ， (3) 销售 ， 动 物 会 创建 销售 的 索引 项 ， 后 面 跟着 动物 和 商品 两 个 缩 进 行 。 


<OBJECT type="application/x-oleobject" 
classId="clsid:1le2a7bd0-dab9-1140-b93a-00c04fc99f9e”"> 
<PARAM name="Keyword" value="’Contents"> 
<PARAM name="*Keyword” value="Introduction”"> 
<PARAM name="Keyword" value=*Sally’'s Pet Store"> 
<PARAM name="Keyword” value="Management "> 
</OBJECT> 
<HTML> <HEAD> 
<TITLE>Sally'’'s Pet Store Introduction</TITLE> 
<LINK rel=”stylesheet" type=*text/css" 
href="*PetHelpStyle.css"> 
</HEAD><BODY> 
<H1>Introduction to Sally's Pet Store</Hl> 
<TABLE><TR> 
<TD><IMG SRC= 'PetStoreLogo2 .gif'′ border=’0’></TD> 
<TD>Sally’s Pet Store is a sample database project for use 
with the Database Management Systems textbook by Jerry 
Post. The database is designed to be a work in progress 
to highlight specific elements.</TD> 
</TR></TABLE> 
<H2>The Pet Store</H2> 
<UL> 
<LI><A HREF='FirmIntroduction.html’>Introduction to the 
Firm</A></LI> 
<LI><A HREF= “Firmprocesses.html’>Processes</A></LI> 
</UL> 
</BODY></HTML> 





图 6-34 帮助 页 部 分 示例 。 用 HTML 把 每 个 主题 作为 一 个 独立 的 网 页 。 标记 
<A> 指 向 其 他 页 。 标 记 <IMG> 下 载 图 像 。 使 用 样式 表 设 置 字体 和 设计 。 
使 用 表格 或 样式 控制 布局 。 在 标记 <OBJECT> 中 写 人 当前 页 的 关键 词 
上 下 文 相关 帮助 
和 应 用 软件 的 Sales 表 单 相关 的 用 户 不 希望 在 多 个 帮助 页 之 间 来 回 切 换 ， 也 不 想 思考 搜索 
词句 。 相 反 ， 当 他 们 按 下 帮助 键 时 ， 期 望 看 到 当前 表单 的 信息 。 至 少 ， 需 要 为 软件 的 每 个 表 
单 创建 不 同 的 帮助 页 。 但 是 ,现在 数据 库 应 用 软件 有 一 些 方法 可 以 指定 每 个 表单 显示 哪个 帮 
助 页 。 如 图 6-35 所 示 ， 每 个 表单 有 一 个 帮助 文件 和 帮助 内 容 ID 属 性 。Oracle 和 Visual Basic 表 单 
有 类 似 的 属性 。 在 帮助 文件 属性 中 输入 文件 名 (例如 ，PetStore.chm)。 帮 助 内 容 ID 需 要 一 个 
数字 。 这 个 数字 是 长 整 型 的 ， 其 范围 从 1 到 20 亿 以 上 。 
注意 到 应 用 软件 需要 主题 编号 至 关 重要 ， 但 是 帮助 文件 通过 文件 名 而 不 是 数字 指向 页 。 为 
了 把 这 两 个 系统 匹配 起 来 ， 必 须 为 每 个 主题 页 赋予 惟一 的 编号 。 使 用 HTML 帮 助 系统 ， 可 以 创 
建 单独 的 文本 文件 〈 通 常 叫做 Topics.h) 记录 对 应 关系 。 图 6-36 是 一 个 示例 文件 。 虽 然 可 以 选 
择 任何 数字 ， 但 是 分 组 赋值 更 容易 记 住 。 还 有 ， 由 于 有 20 亿 的 空间 ， 可 以 在 不 同 组 数 之 间 留 
下 较 大 的 间隔 。 例 如 ， 计 数 单位 最 好 是 百 万 千 万 ， 而 不 是 个 (1、2、3 等 等 ) 。 根 据 业 务 对 象 
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赋值 是 有 效 的 (例如 ， 所 有 的 顾客 帮助 文件 编号 从 1 000 000 到 2 000 000)。 创 建文 件 之 后 ,使 
用 HtmlHelp API Information 按 钮 ( 左 侧 ， 从 上 数 第 四 个 ) 告诉 帮助 工作 组 包括 文件 。 现 在 ， 
浏览 应 用 程序 的 每 一 个 表单 ， 指 定 文件 名 和 主题 编号 。 避 免 在 帮助 文件 中 修改 主题 编号 ， 它 
们 难以 在 应 用 程序 中 找到 。 

在 表单 属性 中 设置 帮助 文件 名 





| 






为 每 个 表单 或 控件 设置 主题 编号 (内 容 ID) 


图 6-35 设置 上 下 文 相关 帮助 。 在 每 个 表单 中 ， 输 入 帮助 文件 属性 中 的 帮助 文 
件 名 。 然 后 在 帮助 内 容 ID 中 输入 该 表单 的 主题 编号 。 每 个 控件 或 子 表 
单 还 可 以 有 另 一 个 不 同 的 帮助 主题 一 一 只 需 输 入 相应 的 主题 编号 





PetStoreIntro 100 
Accounting 10000 
Animal 20000 
AnimalPurchase 30000 
ClassDiagram 40000 
Copyright 50000 
Customer 60000 
DatabaseDesign 70000 
Employee 80000 
FirmIintroduction 90000 
FirmProcesses 100000 
Inventory 110000 
Marketing 120000 
MerchandisePurchases 130000 
MerchandiseReceipt 140000 
Sale 150000 





图 6-36 对 应 文件 。 应 用 程序 通过 数字 指向 主题 ， 但 是 帮助 系统 使 用 文件 名 。 
对 应 文件 (Topics.h) 是 一 个 简单 的 文本 文件 ， 它 为 每 页 赋予 一 个 编号 
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小 结 


表单 设计 必须 与 用 户 的 工作 相 匹 配 ， 这 样 的 应 用 软件 使 用 起 来 才 容易 。 为 了 满足 这 一 点 ， 
需要 注意 设计 原则 ， 操 作 系统 指导 以 及 人 的 缺陷 。 在 任何 可 能 的 情况 下 ， 构 造 通过 直接 操作 
对 象 的 方式 来 使 用 的 表单 ， 例 如 把 项 目 从 一 个 地 方 拖 搜 到 另 一 个 地 方 表示 移动 。 

表单 基于 表 或 查询 。 每 个 表单 有 单一 的 目的 ， 并 且 可 以 在 一 张 表 中 保存 数据 。 更 复杂 的 表 
单 可 以 通过 把 子 表单 放 在 主 表单 中 创建 。 表 单 的 控件 用 于 向 表 输 入 数据 ， 执 行 查询 函数 以 及 
操作 数据 。 一 些 标准 的 控件 可 以 从 Windows 环 境 中 获得 (例如 ， 文 本 框 、 组 合 框 和 单 选 按钮 ) 。 
可 以 购买 附加 的 控件 完成 更 复杂 的 工作 ， 例 如 用 于 时 间 安 排 的 日 历 和 三 维 图 像 。 

报表 常用 于 打印 ， 它 与 表单 不 同 ， 因 为 报表 是 为 表现 数据 而 设计 的 ， 而 不 是 收集 数据 。 有 
几 种 类 型 的 表单 ， 但 是 很 多 商业 表单 使 用 部 分 和 或 分 组 来 显示 不 同 层次 的 数据 。 例 如 ， 销 售 
报表 可 能 根据 销售 部 门 分 组 ， 或 者 根据 销售 员 分 组 ， 或 者 同时 使 用 两 者 。 使 用 查询 把 所 有 报 
表 需 要 的 数据 项 连接 起 来 。 使 用 报表 生成 器 有 两 点 好 处 : (1) 可 以 直接 设置 数据 格式 和 排 
列 ， (2) 报表 可 以 包括 详细 列表 、 部 分 和 、 总 和 。 


详 向 导 可 以 创建 基 术 的 表单 但 是 ， 在 使 用 表单 向 导 和 
的 工作 和 整体 设计 。 尝 试 把 最 重要 的 信息 放 在 一 个 中 


类 级 表单 辅助 。 努 力 设计 一 个 整洁 的 、 组 织 良好 的 界面 ， 少 使 用 
Se eo eye Rh 
创建 基本 的 表单 和 报表 。 





关键 记 

可 访问 性 拖 放 页 脚 
美学 反馈 页 收 

绑 定 控件 焦点 报表 尾 注 
复 选 杠 分 组 中 断 报表 标题 
清晰 性 盲 打 滚动 条 
组 合 框 帮助 系统 单行 表单 
命令 按钮 ”人 性 化 设计 样式 表 
一 玛 性 超 文本 标记 语言 (HTML) 子 表单 
上 下 文 相关 菜单 列表 框 导航 表单 
控件 菜单 Tab 顺 序 
对 象 的 直接 操作 模式 框 表格 表单 
可 停靠 的 单 选 按钮 工具 提示 


工具 栏 Unicode 
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复习 题 

设计 表单 时 哪些 人 性 化 因素 应 该 重点 考虑 ? 
如 何 使 得 应 用 程序 为 更 多 的 用 户 所 使 用 ? 
表单 的 主要 类 型 有 哪些 ? 

表单 中 主要 的 控件 有 哪些 ? 

复 选 框 和 单 选 按钮 的 区 别 是 什么 ? 

子 表单 的 目的 是 什么 ? 

主要 的 报表 类 型 有 哪些 ? 

报表 的 主要 部 分 有 哪些 ? 

. 完成 应 用 程序 需要 哪些 功能 ? 

10. 一 般 来 说 ， 菜 单 的 目的 是 什么 ? 它 应 该 包括 哪些 项 目 ? 
11. 为 什么 上 下 文 相关 帮助 如 此 重要 ? 

12. 创建 HTML 帮 助 文件 有 哪 几 步 ? 


练习 


根据 第 2 章 和 第 3 章 的 练习 所 描述 的 数据 库 创 建 表 、 初 始 表 单 和 报表 。 

1. 游艇 租 货 ， 第 2 章 练习 1。 

2. 完 物 饲养 ， 第 2 章 练习 2。 

3. 牙医 预约 ， 第 2 章 练习 3。 

4. 定制 圣 ， 第 2 章 练习 4。 

5. 电台 播放 清单 ， 第 2 章 练习 8。 

6. 收费 系统 ， 第 2 章 练习 9。 

7. 网 站 注释 ， 第 3 章 练习 1。 

8. 网 上 销售 ， 第 3 章 练习 2。 

9. 人 力 和 资源 福利 ， 第 3 章 练习 3。 

10. 车 库 乐 队 ， 第 3 章 练习 4。 

11. 草坪 护理 ， 第 3 章 练习 5。 

12. 宴会 设施 ， 第 3 章 练 习 6。 

13. 钟表 制造 商 ， 第 3 章 练习 7。 

14. 比萨 外 卖 ， 第 3 章 练习 8。 

15. 动画 工作 室 ， 第 3 章 练习 9。 

16. 设计 师 签 名 的 牛仔 裤 ， 第 3 章 练习 10。 

17. 对 于 已 有 的 数据 库 ， 创 建 主导 航 表单 。 把 它 作为 最 终 版 本 ， 包 括 所 有 必须 的 表单 和 报表 的 
连接 一 一 即使 还 没有 创建 的 。 找 到 法 在 的 用 户 (或 另 一 个 学 生 ) 测试 布局 和 结构 。 

18. 生成 小 的 帮助 文件 。 创 建 至 少 三 页 带 链接 的 HTML 文 件 ， 其 中 一 页 作为 起 始 页 。 给 每 页 设 
置 关键 词 ， 用 Hl1、H2 和 H3 标记 建立 内 容 表 。 定 义 主题 编号 。 使 用 HTML 帮 助 系统 生成 编 
译 后 的 帮助 文件 并 测试 它 。 把 它 添加 到 每 个 表单 指向 独立 页 的 数据 库 ， 再 测试 它 。 


omewhwmnpb 一 
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19. 建立 定制 的 工具 栏 和 菜单 ， 能 够 执行 简单 的 任务 ， 例 如 打开 主 菜单 ， 显 示 主 要 顾客 的 表单 。 

20. 复习 所 用 的 PDBMS 文 档 ， 确 认 它 提供 的 支持 直接 操作 对 象 的 功能 ， 例 如 拖 放 。 

Sally 的 宠物 商店 

21. 建立 表单 管理 商品 存货 ， 包 括 表 Breed、Category 和 Merchandise 的 表单 。 

22. 创建 表单 记录 来 自 供应 商 的 动物 的 订单 。 

23. 创建 表单 记录 来 自 供 应 商 的 商品 的 订单 和 收据 。 

24. 创建 表单 按照 主要 类 别 显示 商品 销售 的 图 表 。 

25. 确认 数据 库 应 用 程序 中 所 有 需要 包括 的 任务 ， 重 新 设计 主导 航 表单 。 

26. 创建 表单 允许 管理 者 根据 某 种 常见 条 件 ( 例 如， 购买 猫 的 项 目 ， 购物 超过 某 个 金额) 选择 
用 户 ， 然 后 建立 每 个 选中 顾客 的 邮件 标签 报表 。 

27. 创建 报表 ， 根 据 商 品 和 动物 的 销售 列 出 雇员 ， 显 示 图 表 把 每 个 雇员 的 销售 总 数 与 全 部 的 总 
数 相 比较 。 

28. 创建 表单 ， 允 许 管 理 者 选择 某 个 时 间 范 围 ， 然 后 绘制 图 表 显 示 该 时 段 从 每 个 供应 商 那 里 购 
买 的 所 有 商品 。 

29. 创建 报表 ， 按 类 别 和 星期 显示 所 有 商品 的 销售 。 其 中 包括 图 表 按照 类 别 比较 全 部 销售 的 
情况 。 

30. 创建 报表 ， 按 州 显示 总 销售 情况 。 

Rolling Thunder 自 行车 

31. 绘图 显示 Rolling Thunder 的 表单 如 何 关联 。 

32. 按照 简单 的 主 表单 /详细 子 表单 建立 自行 车 表单 。 和 已 有 的 表单 比较 。 优 缺点 各 有 哪些 ? 

33. 创建 表单 ， 显 示 在 某 个 指定 时 间 范 围 内 不 同型 号 的 自行 车 销售 (价值 和 数量 ) 的 图 表 。 时 
间 范 围 应 该 从 表单 的 文本 框 输入 ， 带 有 重 绘 功能 。 

34. 创建 表单 ， 允 许 会 计 输 入 日 期 ， 并 生成 报表 ， 列 出 每 个 供应 商 和 截至 该 日 期 拖欠 该 供应 商 
的 货款 。 

35. 创建 报表 ， 显 示 各 州 、 该 州 的 相关 商店 和 零售 商店 的 总 销售 。 包 括 州 总 销售 。 

36. 创建 新 的 应 用 程序 工具 栏 /菜单 。 包 括 根 据 顾 客 、 制 造 商 和 供应 商 选择 表单 的 菜单 。 包 括 指 
向 该 类 的 适当 表单 和 报表 的 连接 。 

37. 创建 报表 ， 按 型 号 和 月 份 显示 自行 车 销售 。 包 括 按 型 号 比较 总 销售 的 图 表 。 

38. 创建 报表 ， 按 雇员 和 年 份 显 示 自 行车 销售 。 包 括 雇 员 每 年 的 销售 比较 图 表 。 

39. 创建 报表 ， 按 月 份 绘制 制造 每 种 型 号 的 自行 车 的 平均 时 间 图 表 。 

40. 创建 表单 ， 人 允许 管理 者 选择 某 个 部 件 ， 然 后 生成 图 表 ， 显 示 过 去 这 个 部 件 的 购买 和 销售 状况 。 


参考 网 站 
网 站 描述 
http://www.microsoft.com/enable 可 访问 性 指导 
http://www.unicode.org Unicode 信 息 的 主要 网 站 
http://www.acm.org/sigchi/ 美国 计算 机 学 会 一 一 特别 兴 了 : 人 机 交互 
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第 7 章 


数据 库 完 整 性 和 事务 





本 章 学 习 内 容 


。SQL 如 此 强大 ， 为 什么 还 需要 程序 代码 ? 

。 如 何 利 用 数据 触发 器 自动 地 更 新 数据 ? 
。DBMS 如 何 保 证 相关 的 更 新 一 起 完成 ? 

。 如 何 处 理 多 用 户 同 时 更 新 相同 的 数据 ? 

。 内 部 码 值 是 如 何 生 成 的 ?在 更 新 中 如 何 使 用 ? 
。 数 据 库 游标 的 目的 是 什么 ? 


7.1 开发 漫谈 


Ariel， 。 喝 ， 应 用 部 分 结束 了 吗 ? 

Miranda， 没有 。 基 本 表单 和 报表 结束 了 。 但 是 我 还 遇 到 了 一 些 问题 。 

Ariel: 看 来 问题 总 是 有 的 。 什 么 问题 呢 ? 

Miranda， 哦 ， 数 据 有 的 时 候 会 发 生 错 误 。 好 像 是 当 几 个 人 同时 操作 同一 个 数据 时 发 生 
的 。 而 且 应 用 程序 有 的 时 候 比 较 慢 。 还 有 …… 

Ariel: 好。 我 知道 了 。 但 是 这 些 问题 看 起 来 很 普通 。 数 据 库 系统 还 有 别 的 辅助 工具 吗 ? 

Miranda， 有 的 。 我 要 开始 看 一 些 有 关 编 程 的 内 容 和 数据 触发 器 。 然 后 ， 我 认为 索引 可 
以 帮助 提高 性 能 。 


7.2 简介 


业务 应 用 经 常 发 生 一 些 常见 问题 。 例 如 ， 多 个 用 户 可 能 同时 试图 更 新 同一 份 数据 ， 或 者 多 
个 修改 需要 一 起 完成 ， 或 者 需要 生成 表 的 新 ID 。 这 些 问题 必须 正确 处 理 ， 才 能 保证 数据 的 完 
整 性 。 虽 然 SQL 命 令 是 强 有 力 的 工具 ， 但 是 在 这 些 情况 下 ， 需 要 执行 多 个 语句 ， 或 选择 执行 哪 
个 命令 。 数 据 库 系统 调用 过 程 语言 来 处 理 这 些 情况 。 

虽然 有 多 种 方法 实现 过 程 语言 ， 但 是 把 语言 捞 入 查询 系统 是 有 益 的 。 用 这 种 方式 ， 所 有 的 
代码 和 条 件 仍 旧 在 数据 库 定义 和 限制 之 中 ， 而 且 可 以 在 程序 中 自动 执行 。 这 些 条 件 通 常 以 数 
据 触发 器 的 形式 给 出 ， 触 发 器 是 一 段 代码 ， 当 某 个 数据 元 素 被 修改 时 执行 。 

事务 、 并 发 访问 和 码 生 成 问题 是 几乎 每 个 事务 程序 都 会 遇 到 的 。 本 章 描述 相关 问题 并 给 出 
常见 的 解决 方案 。 
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对 于 大 数据 集 的 数据 库 , 性 能 是 一 个 棘手 的 问题 。 涉及 多 张大 表 的 复杂 查询 运行 很 长 时 间 。 
但 是 ， 基 于 事务 的 应 用 程序 需要 快速 处 理 数据 。 开 发 商 已 经 投入 了 可 观 的 资金 和 时 间 来 提高 
性 能 。 常 见 的 解决 方案 是 建立 表 的 索引 。 读 者 需要 理解 基本 的 索引 技术 ， 有 更 多 的 方法 提高 
应 用 程序 的 性 能 。 


7.3 过 程 语言 


过 程 语 言 是 传统 的 程序 语言 ， 可 以 指定 一 组 命令 的 执行 顺序 。 常 见 的 SQL 命令 不 是 过 程 语 
言 ， 因 为 只 需要 告诉 DBMS 做 什么 ， 而 不 需要 告诉 它 怎 么 做 。 虽 然 SQL 命 令 强大 ， 有 时 候 需要 
控制 更 精确 的 过 程 语言 。 例 如 ， 指 定 一 组 命令 必须 按照 某 个 特定 顺序 执行 ， 并 且 必 须 所 有 的 
命令 都 执行 完毕 事务 才 算 成 功 。 或 者 ， 只 有 在 某 个 外 部 条 件 满足 时 才 执行 一 些 命令 。 在 更 复 
杂 的 情况 下 ， 可 能 需要 逐 行 地 在 表 上 进行 操作 ， 才 能 完成 某 个 复杂 计算 。 


7.3.1 代码 应 该 放 在 哪里 


图 7-1 展 示 过 程 语言 代码 经 常 出 现 的 三 个 地 方 : (1) 查询 系统 ， (2) 表单 和 报表 ， (3) 
外 部 程序 。 一 般 来 说 ， 和 数据 直接 相关 的 代码 应 该 放 在 查询 系统 中 。 原 因 是 直接 了 当 的 : 把 
代码 放 在 距离 数据 最 近 的 地 方 ， 只 需要 写 一 次 ， 而 不 是 复制 到 多 个 表单 中 。 更 重要 的 是 ， 
DBMS 可 以 保证 代码 执行 而 不 是 跳 过 。 考 虑 一 个 安全 情况 ， 每 次 修改 雇员 工资 都 要 向 日 志 表 写 
入 记录 。 如 果 依 靠 程序 员 在 表单 中 实现 这 段 代 码 ， 他 们 可 能 忘记 做 ， 或 者 做 错 。 还 有 ， 有 人 
可 以 创建 全 新 的 表单 ， 或 者 甚至 使 用 查询 语句 直接 修改 数据 ， 而 不 执行 安全 代码 。 把 代码 放 
在 数据 库 中 ， 提 供 了 一 种 机 制 ， 保 证 在 任何 时 候 只 要 数据 改变 就 可 以 执行 ， 而 不 论 这 种 修改 
如 何 产生 。 在 SQL 标准 中 ， 存 放 在 数据 库 中 的 过 程 代码 叫做 持久 存储 模块 (PSM) ， 相 关 的 过 
程 和 函数 可 以 存放 在 开发 商定 义 的 模块 中 。 






图 7-1 过 程 代码 的 位 置 。 代 码 通常 位 于 查询 系统 、 数 据 库 表单 或 者 外 部 程序 中 。 
在 可 能 的 情况 下 ， 代 码 应 该 放 在 查询 系统 中 ， 这 样 不 会 被 跳 过 
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表单 中 的 代码 应 该 集中 于 处 理事 件 或 特定 表单 的 定制 问题 。 另 一 方面 ， 把 代码 放 在 独立 的 
外 部 文件 是 第 10 章 介绍 的 多 层 客 户 机 /服务 器 系统 经 常 采用 的 技术 。 它 具有 把 业务 逻辑 固化 在 
某 个 位 置 的 优势 。 业 务 逻 辑 和 DBMS 相 分 离 使 得 必要 时 更 换 DBMS 更 为 简便 。 


7.3.2 用 户 定义 的 函数 


用 户 定义 的 函数 是 过 程 代 码 的 最 好 例证 。 有 时 候 ， 需 要 在 多 个 不 同 查询 中 使 用 计算 。 即 使 
计算 相对 简单 ， 把 代码 放 在 一 个 地 方 ， 使 得 以 后 查找 和 修改 更 为 简单 。 可 以 使 用 过 程 代码 定 
义 自 己 的 函数 名 称 ， 进 行 任何 需要 的 计算 。 可 以 以 参数 的 形式 传递 表 的 值 。 图 7-2 提 供 一 个 估 
算 成 本 的 简单 函数 的 例子 。 实 际 上 ， 这 个 函数 使 用 表 和 查询 更 好 ， 但 是 它 说 明了 用 户 定义 国 
数 的 基本 思想 。 函 数 接收 值 ， 对 这 些 参数 进行 计算 ， 向 调用 程序 返回 值 。 还 可 以 创建 过 程 ， 
它 和 函数 的 区 别 在 于 过 程 不 返回 值 。 但 是 ， 几 平 所 有 的 情况 下 ， 可 以 使 用 函数 一 只 要 返回 错 
误 代 码 。 


CREATE FUNCTION EstimateCosts 

(ListPrice Currency, ItemCategory VarChar) 
RETURNS Currency 
BEGIN 

IF (ItemCategory = ‘Clothing’)THEN 


RETURN Listprice * 0.5 
ELSE 
RETURN ListPrice * 0.75 
END IF 
END 





图 7-2 用 户 定义 的 函数 。 即 使 函数 不 复杂 ， 把 业务 逻辑 放 在 一 个 集中 的 位 置 也 
会 方便 以 后 查找 和 修改 。 这 个 函数 可 以 使 用 其 他 代码 片断 或 使 用 
SELECT 语句 


图 7-3 展 示 一 个 函数 使 用 输入 参数 更 新 数据 库 。 参 数 可 以 用 在 任何 SQL 语 名 中 。 还 可 以 创 
建 局 部 变量 修改 参数 ， 然 后 在 SQL 语 句 中 使 用 。 如 果 有 必要 ， 函 数 可 以 任意 复杂 。 过 程 语言 系 
统 包 括 任何 程序 语言 的 标准 元 素 : 变量 、 条 件 、 循 环 、 子 例 程 。 


CREATE FUNCTION IncreaseSalary 
(EmpID INTEGER, Amt CURRENCY) 

RETURNS CURRENCY 

BEGIN 
IF (Amt > 50000) THEN 
RETURN-1 --error flag 


END 
UPDATE Employee SET Salary = Salary + Amt 
WHERE EmployeelD = EmpID; 
RETURN Amt; 
END 





图 7-3 更 新 数据 库 的 函数 。 输 入 参数 用 于 给 SQL 语句 赋值 。 如 果 需 要 ， 可 以 增 
加 计算 ， 修 改 参数 
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7.3.3 查找 数据 


过 程 和 函数 经 常 需 要 使 用 来 自 表 或 查询 的 数据 。 从 单行 中 获得 数据 可 以 直接 使 用 SELECT 
INTO 语 句 。 它 和 标准 的 SELECT 语句 类 似 ， 区 别 在 于 它 把 值 存在 局 部 变量 中 ， 而 不 是 显示 值 。 
但 是 ， 必 须要 保证 SELECT 语句 只 返回 单行 数据 。 如 果 在 WHERE 条 件 中 发 生 错误 ， 返 回 多 行 ， 
就 会 产生 错误 。 

图 7-4 展 示 如 何 使 用 SELECT INTO 语 名 检索 单个 值 。 语 句 可 以 用 来 从 多 列 中 检索 数据 ， 但 
是 只 有 一 行 。 只 需 在 SELECT 行 增加 COLUMN INTO VARIABLE， 并 用 逗号 把 它 和 已 有 行 分 
开 。 注 意图 7-3 和 图 7-4 的 区 别 : 新 的 方法 查询 表 的 最 大 值 。 这 比 使 用 固定 值 更 好 ， 因 为 可 以 创 
建新 的 表单 ， 允 许 管理 者 迅速 修改 这 个 值 。 如 果 在 代码 中 使 用 固定 值 ， 程 序 员 必须 遍历 所 有 
模块 查找 该 值 。 还 有 ， 只 要 有 人 修改 程序 代码 ， 就 存在 引入 新 错误 的 巨大 风险 。 如 果 可 能 ， 
把 重要 的 值 放 在 表 中 ， 需 要 的 时 候 使 用 查询 程序 获得 当前 值 。 


CREATE FUNCTION IncreaseSalary 
{EmpID INTEGER, Amt CURRENCY) 
RETURNS CURRENCY 
DECLARE 
CURRENCY MaxAmount; 
BEGIN 
SELECT MaxRaise INTO MaxAmount 
FROM CompanyLimits 
WHERE LimitName = ‘Raise’; 


IF (Amt > 50000) THEN 
RETURN-1 --error flag 
END 
UPDATE Employee SET Salary = Salary + Amt 
WHERE FEmployeeID = EmpID; 
RETURN Amt; 
END 





图 7-4 查找 单行 数据 元 素 。SELECT INTO 语 句 可 以 用 于 从 表 或 查询 的 某 一 行 
返回 数据 。 结 果 存 储 在 局 部 变量 (MaxAmount) 中 ， 可 以 在 以 后 的 代码 
或 SQL 语句 中 使 用 


7.4 数据 触发 器 


数据 触发 器 是 当 数据 库 中 某 个 事件 发 生 时 执行 的 过 程 。 代 码 位 于 查询 系统 中 ， 保 存 为 数据 
库 的 过 程 或 函数 。 常 见 的 事件 是 更 新 、 插 入 和 删除 ， 但 是 有 的 系统 允许 对 用 户 或 数据 库 实例 
相关 的 事件 附加 代码 。 例 如 ， 可 以 创建 一 个 过 程 ， 当 有 人 修改 Employee 表 的 Salary 列 时 运行 。 
当 数 据 改变 时 ， 该 过 程 记录 做 出 修改 的 人 。 有 了 日 志 ， 和 审计 员 可 以 返回 查看 谁 做 出 的 修改 。 
工资 的 例子 是 数据 触发 器 的 一 个 常见 应 用 ， 它 给 数据 库 增加 了 特殊 的 安全 或 审计 功能 。 它 们 
还 可 以 用 于 管理 事务 ， 例 如 监视 当 现 有 数量 低 于 某 个 值 时 ， 生 成 电子 邮件 或 EDIiJ 单 发 送 到 供 
应 商 。 

图 7-5 列 出 支持 触发 器 的 基本 SQL 命令 。 在 行列 上 的 每 个 主要 数据 触发 器 有 两 个 属性 : 
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BEFORE 和 AFTER。 例 如 ， 可 以 实现 一 个 BEFORE UPDATE 的 过 程 ， 和 另 一 个 AFTER 
UPDATE 过 程 。BEFORE UPDATE 事 件 是 在 用 户 试图 修 
改 数据 ， 但 是 数据 实际 写 人 数据 库 之 前 触发 。 数 据 -- 写 
入 数据库 ，AFTER UPDATE 触 发 器 才 触 发 。 根 据 应 用 
程序 想 做 什么 ， 选 择 事件 。 如 果 想 在 写 入 数据 库 之 前 检 
查 数据 ， 需 要 使 用 BEFORE 触 发 器 。 例 如 ， 想 在 保存 数 
据 之 前 进行 复杂 的 合法 性 验证 。 另 一 方面 ， 如 果 想 记录 


数据 何 时 修改 ， 或 者 需要 修改 另 一 个 数据 ， 可 以 使 用 图 7-5 数据 触发 器 。 可 以 设置 过 程 在 这 
AFTER 触 发 器 些 操作 发 生 时 执行 。 行 事件 可 以 


在 指定 事件 发 生 之 前 或 之 后 触发 
7.4.1 语句 与 行 触 发 器 


SQL 标准 定义 两 个 层次 的 触发 器 : (1) 对 于 整个 表 的 ，(2) 对 于 要 修改 的 每 行 数据 。 图 
7-6 展 示 不 同 触发 器 对 于 UPDATE 命 令 的 工作 时 间 。 整 个 表 的 触发 器 首先 (BEFORE UPDATE) 
触发 ,或 者 在 最 后 (AFTER UPDATE) 触发 。 单 行 触发 器 在 检查 每 行 之 前 或 之 后 触发 。 对 于 
行 触发 器 ， 还 可 以 增加 条 件 检查 行 数据 决定 是 否 触发 或 忽略 触发 器 。 例 如 ， 在 工资 表 中 增加 
行 触 发 器 ， 只 对 某 个 部 门 的 雇员 触发 。 这 个 条 件 和 原始 的 UPDATE WHERE 语句 完全 独立 。 
触发 器 条 件 只 用 于 决定 是 否 触发 。 


INSERT 


BEFORE DELETE 
UPOATE 





UPDATE Empioyee 

SET Salary = Saiary + 10,000 
WHERE EmployeelD = 442 
OR EmployeeslD = 558 


表 更 新 之 前 用 于 整个 表 的 触发 器 表 更 新 之 后 


更 新 442 。 更 新 442 行 ”更 新 442 “ .. 其 他 行 时间 
行 之 前 行 之 后 
用 于 每 行 的 触发 器 





图 7-6 更 新 触发 器 可 以 针对 整个 表 ， 对 于 整个 命令 只 触发 一 次 ， 或 者 每 行 更 新 
时 触发 

图 7-7 是 一 个 触发 器 的 例子 ， 当 修改 Employee 表 的 行 时 触发 。 由 FOR EACH ROW 语句 ， 
这 是 一 个 行 触发 器 。 这 个 例子 还 说 明 触发 器 可 查询 和 使 用 存储 在 目标 表 中 修改 之 前 (OLD 
ROW) 和 修改 之 后 (NEW ROW) 的 数据 。 在 这 种 情况 下 ， 原 始 的 工资 和 新 的 工资 同时 记录 
在 日 志 表 中 。 有 了 这 些 信息 ， 安 全 管理 者 和 审计 员 可 以 迅速 查询 日 志 表 ， 确认 主 要 的 工资 修 
改 ， 进 一 步 研究 保证 修改 合法 。 必 须 小 心 使 用 0LD 和 NEW 数 据 。 例 如 ， 在 BEFORE UPDATE 
触发 器 中 ，NEW 数 据 还 没有 创建 ， 所 以 不 能 访问 。 
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CREATE TRIGGER LogSalaryChanges 
AFTER UPDATE OF Salary ON Employee 
REFERENCING OLD ROW as oldrow 
NEW ROW AS newrow 
FOR EACH ROW 
INSERT INTO SalaryChanges 


(EmpID， ChangeDate， User, OldValue, NewValue) 
VALUES * 
{newrow .EmployeeID, CURRENT TIMESTAMP, 
CURRENT USER, oldrow.sSalary, 

newrow.Salary); 





心 


图 7-7 触发 器 记录 修改 雇员 工资 的 用 户 日 志 。 只 要 工资 更 新 ， 不 论 使 用 何 种 方 


法 修改 数据 , 触发 器 就 会 触发 。 这 是 一 个 有 用 的 敏感 数据 安全 跟踪 技术 ， 
因为 无 法 避 开 它 ， 除 非 是 触发 器 的 拥有 者 


7.4.2 利用 触发 器 取消 数据 更 新 


触发 器 的 一 个 用 途 是 在 写 入 数据 库 之 前 仔细 检查 修改 。BEFORE UPDATE 和 BEFORE 
INSERT 触 发 器 经 常用 于 验证 复杂 条 件 。 删 除数 据 之 前 ， 可 能 希望 更 仔细 地 检查 。 在 这 些 情况 下 ， 
触发 器 的 结构 非常 简单 。 惟 一 的 不 同 是 需要 找到 一 种 方式 停止 执行 原始 SQL 语 句 。WHEN 条 件 
用 于 检查 即将 删除 的 行 。 如 图 7-8 所 示 ，SIGNAL 语 句 产 生 错 误 条 件 阻止 删除 行 。 实 际 的 信号 条 
件 (CANNOT_DELETE_PRESIDENT) 可 以 是 任何 字符 串 , 但 是 在 整个 模块 中 必须 定义 为 常量 。 
大 部 分 数据 库 系 统 不 支持 SIGNAL 关 键 词 ， 所 以 实际 的 语法 依赖 于 你 所 使 用 的 系统 (和 版 本 )。 
CREATE TRIGGER TestDeletePresident 


BEFORE DELETE ON Employee 
REFERENCING OLD ROW AS oldrow 


FOR EACH ROW 
WHEN (oldrow.Title = ‘President’) 
SIGNAL CANNOT_DELETE_PRES; 





图 7-8 取消 的 SQL 命 令 。 这 个 触发 器 检查 要 删除 的 雇员 行 的 数据 。 公 司 总 是 希 
望 保 留 带 有 “President” 标 志 的 雇员 数据 。 WHEN 条 件 逐 行 计 算 。 
SIGNAL 语 句 产生 一 个 错误 阻止 执行 下 面 的 删除 
总 的 来 说 ， 对 于 简单 的 检查 条 件 应 该 尽量 避免 使 用 触发 器 。 相 反 ， 使 用 标准 的 SQL 条 件 
(例如 ，PRIMARY KEY、FOREIGN KEY 和 CHECK) ， 因 为 它们 更 有 效 ， 很 少 引 起 其 他 的 问题 。 


7.4.3 级 联 触发 器 


触发 器 的 复杂 性 在 于 数据 库 的 每 个 表 可 以 有 多 个 触发 器 。 级 联 触 发 器 是 指 当 某 个 修改 触发 
了 某 张 表 的 触发 器 导致 另 一 张 表 的 修改 ， 接 着 又 导致 第 三 张 表 的 修改 ， 如 此 继续 。 图 7-9 是 一 个 
常见 的 库存 情况 。 当 某 个 项 目 卖 出 去 ，SaleItem 表 加 入 包含 卖 出 数量 的 新 的 一 行 。 因 为 该 项 已 
经 卖 出 ，Inventory 表 的 当前 数量 也 随 之 更 新 。Inventory 表 的 触发 器 检查 QOH 是 否 低 于 再 订购 点 。 
如 果 是 ， 生 成 新 的 订单 并 向 供应 商 发 出 电子 邮件 ， 其 结果 是 向 Order 和 Orderltem 表 插入 新 项 。 
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Sale(SalelD, SaleDate, . .. ) 
Saleltem(S$aileiD , ltemip, Quantity, . . . ) 


AFTER INSERT 
UPDATE Inventory 
SET QOH = 00H ~ newrow. Quantity 


Inventory(ltemiD, QOH, . . . ) 


AFTER UPDATE 
WHEN newrow.00H < newrow. Reorder 
INSERT {new order} 
INSERT {new Orderitem} 


Order(QrderiD, OrderDate, . 
Orderitem(OrderiD, emiD, Quantity, . .. ) 





图 7-9 级 联 触发 器 。 当 多 张 表 上 定义 了 触发 器 ， 一 张 表 (Saleitem) 上 的 修改 
可 以 导致 其 他 表 的 级 联 修改 。 在 这 里 ， 当 某 个 项 目 卖 出 ， 当 前 数量 更 新 。 
如 果 QOH 低 于 再 订购 点 ， 生 成 并 发 送 新 的 订单 
级 联 触发 器 本 身 并 没有 错 。 但 是 ， 过 长 的 更 新 链 可 能 降低 系统 速度 。 它 们 还 给 调试 系统 和 
查找 错误 带 来 困难 。 在 这 个 例子 中 ， 比 如 查找 OrderItem 表 的 错误 ， 这 个 错误 可 能 由 SaleItem 表 
的 触发 器 代码 导致 。 这 个 链 越 长 ， 定 位 问题 源 就 越 具有 挑战 性 。 
级 联 触发 器 潜伏 着 更 复杂 的 问题 。 如 果 这 个 链 构成 自身 循环 会 发 生 什么 ? 图 7-10 举 例 说 明 
这 个 问题 。 公 司 已 经 设置 了 几 条 关于 支付 员工 工资 的 规则 。 当 工资 达到 某 个 水 平时 ， 员 工 可 
以 获得 奖金 。 当 员工 已 经 得 到 了 一 定 的 奖金 时 ， 限 制 奖 金 的 数量 ， 同 时 员工 得 到 附加 的 股权 。 
如 果 股 权 达 到 了 革 个 水 平 ， 降 低 原始 工资 。 但 是 这 导致 系统 回 到 开始 状态 ， 工 资 的 变化 触发 
新 一 轮 的 更 新 。 根 据 计 算 结 果 的 不 同 ， 循 环 可 能 导致 发 散 ， 即 数字 越 来 越 大 (或 反 向 增长 ) ， 
并 且 计 算 无 法 结束 。 鉴 于 此 ，SQL 标 准 定义 禁止 触发 器 循环 。 遵 循 这 一 标准 的 系统 会 监视 整个 
更 新 链 ， 如 果 遇 到 循环 ， 取 消 修改 并 发 出 警告 。 即 使 系统 监控 这 类 循环 ， 读 者 也 应 该 亲自 检 
查 系 统 避 免 问题 发 生 。 很 明显 ， 如 果 只 有 有 限 数量 的 触发 器 ， 系 统 很 容易 检查 。 





Empioyee(EID, Salamy) AFTER UPDATE 
一 人 IF newrow. Salary > 100,000 THEN 
Add Bontus 
END 


Bonuspéid(EiD, BonusDate, Amount) 
一 人 AFTER UPDATE Or INSERT 
IF newrow.Bonus > 50,000 THEN 
Reduce Bonus 


Add 0ptions 


StockOptions(EID, OQptionDate, Amount, SalaryAdi) 
一 一 一 AFTER UPDATE Or INSERATY 
IF Howrow.Amount > 100,000 THEN 
Reduce Salary 


图 7-10 触发 器 循环 。 考 虑 级 联 触发 器 构成 循环 会 发 生 什 么 ， 即 其 中 一 个 触发 
器 返回 修改 了 引发 最 初 被 修改 的 表 。 这 个 循环 可 能 收敛 或 发 散 。 即 使 
循环 收敛 ， 也 会 消耗 大 量 资 源 





232 复 三 部 分 应 用 





7.4.4 INSTEAD OF 触发 器 


有 的 数据 库 支持 INSTEAD OF 触发 器 ， 这 是 一 种 功能 更 强大 的 触发 器 。 标 准 的 触发 器 运行 
代码 ， 附 加 执行 基本 的 函数 (DELETE、INSERT 或 UPDATE)。INSTEAD OF 选项 完全 取代 了 
代码 中 基本 的 命令 。 这 样 ， 即 使 修改 应 该 写 人 数据 库 ， 也 必须 编写 额外 的 SQL 语句 执行 适当 的 
动作 。 这 是 一 种 使 查询 可 更 新 的 有 效 技术 。 连 接 多 张 表 的 查询 一 般 是 不 可 更 新 的 ， 数 据 无 法 
加 入 查询 ， 因 为 系统 无 法 知道 哪些 表 有 了 新 行 。 为 了 解决 这 个 问题 ， 可 以 在 查询 中 加 入 
INSTEAD OF 触发 器 。 这 样 必要 的 修改 可 以 用 单独 的 SQL 语句 插入 独立 的 表 中 。 


7.5 事务 


在 构造 应 用 程序 时 ， 各 部 分 一 直 正 常 工作 并 且 从 不 发 生 问题 的 确 诱 人 。 诱 人 ， 但 不 一 定 正 
确 。 即 使 代码 正确 ， 也 可 能 发 生 问 题 。 可 能 面临 电源 切断 、 硬 件 崩溃 、 或 者 可 能 有 人 偶然 拔 
错 电 缆 。 通 过 实现 备份 和 恢复 程序 ， 在 不 同 驱动 器 上 保存 复制 数据 ， 安 装 不 间断 电源 (UPS) 
使 这 些 问 题 最 小 化 。 但 是 ， 不 论 如 何 努 力 ， 失 败 总 会 发 生 。 


7.5.1 事务 的 例子 


在 错误 时 间 发 生 的 错误 可 能 导致 严重 后 果 。 特 别 地 ， 很 多 业务 操作 要 求 多 处 修改 数据 库 。 
事务 定义 为 一 组 必须 一 起 完成 的 改变 。 考 虑 图 
7-11 的 例子 。 在 银行 的 系统 中 ， 某 顾客 操作 ATM 
把 1 000 美 元 从 储 著 账 户 转移 到 支 际 账户 。 这 个 
简单 的 事务 包括 两 步 ，(1) 储蓄 账户 余额 减 去 资 
金 ， (2) 支票 账户 余额 增加 资金 。 创 建 这 个 事 
务 的 代码 要 求 数据 库 的 两 个 更 新 。 例 如 ， 有 两 个 
SQL 语句 : 一 个 UPDATE 命 令 减少 储蓄 账户 余额 ， 
和 第 二 个 UPDATE 命 令 增加 支票 账户 余额 。 

必须 考虑 如 果 在 两 个 操作 之 间 机 器 发 生 故 障 
会 导致 什么 后 果 。 资 金 已 经 从 储蓄 账户 减 去 ， 但 
是 还 未 加 入 支票 账户 。 资 金 丢 失 了 。 读 者 可 能 考 ”图 7-11 涉及 数据 库 多 处 修改 的 事务 。 所 有 的 修 






Inez: 1,424.27 






事务 
1. 储 萃 账户 减 去 1 000 美 元 
器 故 
2. 支票 账户 增加 1 000 美 元 
资金 消失 


先 给 支 要 ,但 全 得 到 多 余 改 必须 同时 生效 ， 否 则 事务 出 错 。 例 如 ， 
庶 先 给 支 账户 湖 加 资金 但 是 顾客 会 得 到 多 余 为 了 把 资金 从 储 蔷 账 户 转移 到 支票 账 
的 资金 ， 而 银行 遭受 损失 。 关键 在 于 两 处 修改 必 户 ， 系统 必须 减少 储蓄 账户 的 资金 ， 同 
须 同 时 成 功 。 时 把 减少 的 资金 加 入 支票 账户 。 如 果 在 

减 去 资金 之 后 、 增 加 支票 账户 之 前 机 器 
7.5.2 事务 的 开始 和 结束 出 现 故 障 ， 资 金发 生 丢失 


如 何 知道 两 个 操作 属于 同一 事务 昵 ? 这 是 商业 规则 ， 或 者 是 资金 转移 定义 。 问 题 是 ， 计 算 
机 如 何 知 道 两 个 操作 必须 同时 完成 ?作为 应 用 程序 开发 者 ， 必 须 告诉 计算 机 系统 哪些 操作 属 
于 一 个 事务 。 为 了 做 到 这 一 点 ， 需 要 标记 代码 中 所 有 事务 的 开始 点 和 结束 点 。 当 计算 机 看 到 
开始 标记 时 ， 首 先 把 所 有 的 修改 写 入 日 志文 件 。 当 它 到 达 结 束 标志 时 ， 对 数据 表 作 实际 的 修 
改 。 如 果 在 修改 完成 之 前 发 生 错 误 ， 当 DBMS 重 启 后 ， 它 检查 日 志文 件 并 完成 所 有 未 完成 的 事 
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务 。 从 开发 者 的 角度 看 ，DBMS 的 好 处 在 于 自动 处 理 问 题 。 读 者 需要 做 的 仅仅 是 标记 事务 的 开 
始 和 结束 。 

事务 处 理 是 需要 过 程 语言 的 一 个 例子 。 如 图 7-12 所 示 ， 多 个 UPDATE 语 名 需要 保存 在 一 个 
模块 函数 或 过 程 中 。 在 这 个 例子 中 ， 两 个 UPDATE 语 句 必须 同时 完成 或 同时 失败 。START 
TRANSACTION 语 名 是 可 选 的 〈SQL99 标 准 ) ， 但 是 突出 了 事务 的 开始 。 如 果 两 个 更 新 成 功 完 
成 ，COMMIT 语 句 执行 ， 告 诉 DBMS 保 存 所 有 修改 。 如 果 发 生 了 意外 的 错误 ，ROLLBACK 语 
名 执行 ， 不 保存 任何 修改 。 大 部 分 系统 通过 把 所 有 的 修改 写 人 中 间 日 志文 件 管理 事务 请 求 。 
如 果 事 务 发 生 错误 ， 系 统 可 以 恢复 日 志文 件 ， 回 滚 或 完成 事务 。 


CREATE FUNCTION TransferMoney (Amount Currency, 
AccountFrom Number,AccountTo Number) 
RETURNS NUMBER 
curBalance Currency; 
BEGIN 
DECLARE HANDLER FOR SQLEXCEPTION 
BEGIN 
ROLLBACK; 
Return-2; -~~flag for completion error 
END; 
START TRANSACTION; -~-optional 
SELECT CurrentBalance INTO curBalance 
FROM Accounts WHERE (AccountID = AccountFrom); 
IF (curBalance < Amount) THEN 
RETURN-1; ~--flag for insufficient funds 
END IF 
UPDATE Accounts 
SET CurrentBalance = CurrentBalance 一 Amount 
WHERE AccountID = AccountFrom; 
UPDATE AccountS 
SET CurrentBalance = CurrentBalance + Amount 
WHERE AccountID = AccountTo; 
COMMIT; 
RETURN 0; --flag for success 
End; 





图 7-12 转移 资金 的 事务 。 如 果 系 统 在 事务 结束 (提交) 之 前 出 错 ， 任 何 修改 
都 不 写 人 数据 库 。 重 启 后 ， 修 改 可 能 全 部 回 滚 ， 或 者 事务 重启 
注意 ，START TRANSACTION 行 在 SELECT 语句 开始 之 前 。 这 看 上 去 没有 必要 ， 似 乎 只 有 
UPDATE 命 令 需 要 在 事务 中 。 把 这 句 话 放 在 前 面 有 语法 原因 : 任何 SELECT 语句 自动 开始 一 个 
新 的 事务 。 但 是 ， 在 并 发 控制 部 分 还 将 给 出 解释 ， 是 在 SELECT 语句 之 前 开始 事务 的 更 好 原因 。 


7.5.3 保存 点 


有 时 候 ， 一 个 事务 需要 中 间 点 。 一 些 元 素 比 其 他 的 更 重要 。 可 能 有 一 些 选 择 性 修改 需要 保 
存 ， 但 是 ， 如 果 它 们 失败 ， 仍 需要 保证 提交 关键 的 更 新 。 保 存 点 (SAVEPOINT) 技术 把 事务 
过 程 分 成 多 个 片断 。 可 以 回 滚 到 事务 的 开始 ， 或 者 某 个 保存 点 。 图 7-13 说 明了 这 一 过 程 ， 展 示 
了 设置 保存 点 和 回 滚 到 它 的 语法 。 正 如 图 中 所 示 ， 它 可 以 用 于 标记 一 组 包括 在 更 新 中 但 却 不 
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是 必要 的 风险 步骤 。 因 此 ， 如 果 风 险 部 分 更 新 失败 ， 可 以 舍弃 这 些 修 改 ， 保 持 事 务 开始 定义 
的 元 素 不 变 。 一 般 来 说 ， 使 用 多 个 COMMIT 语 句 可 以 完成 同样 的 工作 ， 但 是 有 时 可 选 的 代码 
可 能 包括 最 后 结果 中 需要 的 计算 。 如 果 没 有 保存 点 选项 ， 必 须 重 写 最 后 的 值 。 


SAVEPOINT 
Start0ptional 


开始 提交 


需要 的 元 素 风险 步 又 
| 时 间 
、 部 分 回 滚 


START TRANSACTION; 
SELECT . . . 


UPDATE . . . 

SAVEPOINT StartOptional; 

UPDATE . . . 

UPDATE . . . 

If error THEN 

二 ROLLBACK TO SAVEPOINT StartOptional; 





图 7-13 保存 点 。 保 存 点 允许 回 滚 到 程序 的 一 个 中 间 点 。 可 以 设置 多 个 保存 点 ， 
并 选择 回 滚 多 少 修改 


7.6 多 用 户 与 并 发 访问 


数据 库 最 重要 的 功能 之 一 是 多 用 户 或 不 同 进程 能 够 共享 数据 。 在 现代 商业 应 用 中 ， 这 是 一 
个 重要 的 概念 : 很 多 人 需要 同时 使 用 应 用 程序 。 但 是 ， 这 导致 了 数据 完整 性 的 潜在 问题 : 如 
果 两 个 人 同时 试图 修改 同一 份 数据 会 发 生 什么 ? 这 种 情况 就 是 并 发 访问 。 考 虑 图 7-14 的 邮购 系 
统 的 例子 。 公 司 记录 顾客 的 基本 数据 ， 监 督 顾客 的 付款 和 收据 。 顾 客 还 有 未 结 清 的 货款 ， 即 
他 们 当前 的 债务 。 在 这 个 例子 中 ， 琼 斯 从 公司 800 美 元 。 当 琼斯 付款 之 后 ， 办 事 员 收 到 付款 并 
检查 余额 (800 美元) 。 办 事 员 输入 付款 数目 〈200 美 元 ) ， 计 算 机 做 减法 得 到 新 的 债务 余额 
(600 美 元 ) 。 新 值 写 六 顾客 表 ， 代 替 旧 值 。 至 此 ， 没 有 问题 。 如 果 琼 斯 做 出 新 的 购买 ， 过 程 类 
似 。 只 要 这 两 个 事件 不 同时 发 生 ， 就 没有 问题 。 


接受 付款 顾客 提交 新 订单 





图 7-14 并 发 访问 。 如 果 两 个 程序 同时 试图 修改 同一 份 数据 ， 结 果 发 生 错误 。 
在 这 个 例子 中 ， 接 受 付款 后 的 修改 被 同时 提交 的 新 订单 覆盖 


但 是 ， 如 果 两 个 事务 同时 发 生 会 怎么 样 ? 考虑 下 面 的 情况 混合 : “(1) 付款 办 事 员 接受 付 
款 ， 计 算 机 查询 琼斯 的 当前 欠 款 余额 (800 美 元 ) 。(2) 办 事 员 输入 付款 200 美 元 。 在 事务 结束 
之 前 ， 琼 斯 正在 给 另 一 个 办 事 员 打 电话 ， 订 购 150 美 元 的 新 商品 。(3) 这 个 办 事 员 的 计算 机 也 
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读 取 当 前 欠 款 余额 《800 美 元 ) ， 并 增加 新 的 购买 。 现 在 ， 在 这 个 事务 结束 之 前 ， 第 一 个 完成 
了 。(4) 付款 办 事 员 的 计算 机 得 到 琼斯 目前 欠 600 美 元 并 保存 欠 款 余额 。(5) 最 后 ， 订 货 办 事 
员 的 计算 机 把 新 的 购物 加 入 欠 款 余额 。(6) 订购 计算 机 保存 新 的 欠 款 (950 美 元 ) 。 顾 客 琼斯 
在 接收 到 下 一 个 账单 时 注定 要 心烦 意 乱 了 。200 美 元 的 付款 发 生 了 什么 ? 答案 是 当 新 订购 修改 
和 接受 付款 混合 在 一 起 时 ， 付 款 被 覆盖 (并 丢失 ) 了 。 


7.6.1 悲观 锁 ， 串 行 化 


解决 并 发 控制 问题 的 一 种 方案 是 强制 事务 以 完全 隔离 的 方式 执行 ， 完 全 禁止 并 发 执行 。 如 
图 7-15 所 示 ， 事 行 化 进程 强制 事务 独立 运行 ， 这 样 一 个 进程 甚至 无 法 读 取 正 被 另 一 个 进程 修改 
的 数据 。 


把 事务 设置 为 串 行 化 ， 读 写 





接收 付款 


提交 新 订单 
3) 读 取 余额 






局 收 到 加 锁 的 错误 信息 





图 7-15 串 行 化 。 第 一 个 进程 对 数据 加 锁 ， 这 样 第 二 个 进程 甚至 无 法 读 取 。 通 
过 强制 每 个 进程 等 待 前 一 个 进程 完成 ， 避 免 并 发 修改 


这 种 类 型 的 锁 机 制 的 使 用 依赖 于 DBMS。SQL99 定 义 了 标准 的 指定 事务 锁 的 方法 ， 但 是 没 
有 广泛 实现 。 如 图 7-16 展 示 基 本 的 逻辑 ， 但 是 记 住 不 同 DBMS 的 语法 可 能 不 同 。 主 要 步 又 是 在 
SET TRANSACTION 语 句 中 指定 SERIALIZABLE 的 隔离 草 级 。 然 后 DBMS 给 每 个 可 能 使 用 的 
数据 加 锁 ， 这 样 其 他 的 事务 在 第 一 个 修改 提交 之 前 无 法 读 取 该 数据 。 但 是 ， 所 有 的 事务 过 程 
包括 错误 管理 代码 很 重要 。 否 则 ， 当 第 二 个 事务 (RecordPurchase 与 此 几乎 相同 ) 运行 ， 试 图 
更 新 或 读 取 数据 时 ， 它 失败 并 显示 含糊 的 错误 消息 。 


CREATE FUNCTION ReceivePayment ( 
AccountID NUMBER, Amount Currency) RETURNS 
NUMBER 
BEGIN 
DECLARE HANDLER FOR SQLEXCEPTION 
BEGIN 
ROLLBACK; 
RETURN-2; 
END 
SET TRANSACTION SERIALIZABLE, READ WRITE; 
UPDATE Accounts 
SET AccountBalance = AccountBalance 一 Amount 
WHERE AccountNumber = AccountID; 
COMMIT; 
RETURN 0; 
END 





图 7-16 转移 资金 的 事务 。 如 果 在 事务 结束 〈 提 交 ) 之 前 系统 出 错 ， 没 有 任何 
修改 写 入 数据库。 重启 后 ， 修 改 可 能 全 部 回 滚 ， 或 者 事务 重启 
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品行 化 的 概念 是 合乎 逻辑 的 ， 它 强调 了 强迫 每 个 事务 完全 分 离 的 重要 性 。 但 是 ， 它 基于 翡 
观 锁 技术 一 每 个 事务 都 假定 并 发 引用 总 会 发 生 。 每 次 事务 运行 ， 给 所 有 需要 的 资源 加 锁 。 这 
个 技术 可 以 导致 下 一 节 描 述 的 另 一 个 严重 问题 。 


7.6.2 多 用 户 数据 库 : 并 发 访问 与 死 锁 


如 果 在 同一 时 刻 ， 有 两 个 进程 试图 修改 同一 个 数据 ， 那 么 会 发 生 并 发 访问 的 问题 。 当 两 个 
进程 混合 起 来 ， 出 现 一 个 事务 丢失 和 数据 不 正确 的 情况 。 对 于 大 部 分 数据 库 操作 ，DBMS 可 以 
自动 处 理 这 些 问题 。 例 如 ， 如 果 两 个 用 户 打开 表单 并 试图 修改 同一 份 数据 ，DBMS 会 给 出 适当 
的 敖 告 并 在 第 一 个 修改 完成 之 前 阻止 第 二 个 用 户 修改 。 类 似 地 ， 两 个 SQL 操 作 (例如 ， 
UPDATE) 不 能 同时 修改 同一 数据 。 

即使 编写 程序 代码 ，DBMS 也 不 允许 两 个 进程 同时 修改 同一 数据 。 尽 管 如 此 ， 必 须 理解 代 
码 中 的 数据 修改 可 能 不 被 允许 。 这 种 情况 经 常 作为 错误 处 理 。 

并 发 问题 的 解决 方案 是 强制 每 个 数据 一 次 只 发 生 一 个 修改 。 如 果 两 个 进程 试图 修改 ， 第 二 
个 停止 并 等 待 第 一 个 进程 结束 。 这 样 做 产生 的 延迟 
可 能 导致 另 一 个 问题 : 死 锁 。 当 两 个 (或 多 个 ) 进 
程 已 经 对 数据 加 锁 并 希望 对 其 他 数据 加 锁 时 发 生死 3) 等 竺 数据 B 
锁 。 如 图 7-17 的 例子 。 进 程 1 已 经 对 数据 A 加 锁 ， 进 
程 2 已 经 对 数据 B 加 锁 。 不 幸 的 是 ， 进 程 1 正在 等 待 
B 释 放 ， 而 进程 2 正在 等 待 进程 A 释放 。 除 非 发 生 其 
他 事件 ， 这 会 导致 长 时 间 的 等 待 。 

欧 锁 问题 有 两 个 常见 的 解决 方案 。 第 一 ， 当 一 
个 进程 收 到 它 必须 等 竺 某 个 资源 的 消息 时 ， 该 进程 
随机 等 待 一 段 时 间 之 后 ， 重 新 尝试 ， 释 放 所 有 已 经 
存在 的 锁 ， 如 果 还 没有 得 到 资源 则 重新 开始 。 这 个 图 7-17 死 锁 。 进 程 1 已 经 对 数据 A 加 锁 ， 并 
方法 之 所 以 有 效 是 因为 随机 等 待 。 两 个 死 锁 的 进程 等 待 数 据 B。 进 程 2 已 经 对 数据 B 加 锁 ， 
释放 所 有 的 锁 。 释 放 为 其 他 进程 完成 工作 扫 清 了 道 
路 。 这 种 解决 方案 很 常见 ， 因 为 它 容 易 编程 实现 。 但 是 ， 它 的 缺点 是 导致 计算 机 花费 大 量 时 
间 等 待 一 尤其 当 很 多 活动 进程 导致 很 多 冲突 的 时 候 。 

更 好 的 解决 方案 是 DBMS 建 立 全 局 锁 管理 器 ， 如 图 7-18 所 示 。 锁 管理 器 管理 每 个 锁 并 要 求 
锁 (等 待 )。 如 果 锁 管理 器 发 现 潜在 的 死 锁 ， 会 告知 某 些 进程 释放 锁 ， 人 允许 其 他 进程 继续 ， 然 
后 重启 那些 放弃 的 进程 。 这 种 解决 方案 效率 更 高 ， 因 为 进程 没有 等 待 时 间 。 另 一 方面 ， 这 种 
解决 方案 只 有 DBMS 本 身 才能 实现 。 锁 管理 器 必须 能 够 监控 每 个 进程 及 其 锁 。 

对 于 典型 的 数据 库 表 单 和 查询 操作 ，DBMS 自 动 管理 并 发 访问 和 死 锁 处 理 。 当 通过 编写 代 
码 修改 数据 时 ，DBMS 仍 试图 自动 管理 。 但 是 ，DBMS 可 能 希望 程序 撤销 事务 。 有 的 系统 在 有 
其 他 进程 试图 访问 数据 时 简单 地 生成 错误 信息 ， 程 序 必 须 捕获 错误 并 处 理 问题 。 
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图 7-18 锁 管 理 器 。 全 局 锁 管理 器 跟踪 所 有 加 锁 的 资源 和 相关 进程 。 如 果 发 现 
循环 ， 那 么 死 锁 存在 ， 然 后 锁 管理 器 指导 进程 释放 锁 ， 直 到 问题 解决 


7.6.3 乐观 锁 


多 年 来 ， 悲 观 锁 和 死 锁 管理 是 很 多 系统 的 标准 做 法 。 最 近 ， 另 一 种 方法 受到 欢迎 。 随 着 计 
算 机 系统 性 能 提高 ，DBMS 可 以 更 快 地 处 理事 务 ， 其 结果 是 出 现 并 发 问题 的 可 能 性 降低 了 。 乐 
观 锁 假 设 冲突 很 少 或 不 可 能 发 生 。 如 果 确 实 发 生 了 ， 再 处 理 也 容易 。 翡 观 锁 和 死 锁 方 案 需要 
可 观 的 编程 量 和 计算 机 资源 才能 正确 管理 。 尤 其 在 分 布 式 数据 库 环 境 中 ， 使 用 乐观 锁 更 容易 ， 
也 更 快 。 

理解 乐观 锁 的 关键 在 于 认识 到 它们 不 是 实际 的 锁 ，DBMS 人 允许 程序 读 取 任 何 需 要 的 数据 。 
当 程序 试图 修改 数据 时 ，DBMS 重 新 读 取 数 据 库 , 并 把 当前 存储 的 数据 和 先前 获得 的 进行 比较 。 
如 果 这 两 个 值 不 同 ， 表 明 存 在 并 发 问题 ， 因 为 任务 完成 之 前 有 其 他 人 修改 了 数据 。DBMS 产 生 
一 个 错误 ， 并 期 望 程序 处 理 。 总 的 来 说 ， 乐 观 锁 可 以 提高 性 能 ， 但 是 它 要 求 程序 员 处 理 潜 在 
的 冲突 。 图 7-19 列 出 了 基本 过 程 。 


1 读 取 余额 


2. 增加 新 的 订单 值 
3. 写 新 的 余额 
4. 检查 错误 


5. 如 果 发 生 错误 ， 回 到 步 又 1 








图 7-19 乐观 锁 进程 。 这 些 步 又 假定 并 发 问题 不 会 发 生 。 如 果 在 该 事务 结束 之 
前 ， 另 一 个 事务 修改 了 数据 ， 代 码 收 到 错误 消息 并 重新 启动 
前 面 提 到 的 使 用 乐观 锁 处 理 冲 突 的 方法 是 撤销 已 经 做 出 的 全 部 修改 ， 然 后 重新 开始 ， 从 数 
据 库 读 取 当前 值 ， 重 新 计算 修改 ， 再 把 新 值 写 人 数据 库 。 考 虑 图 7-20 的 例子 。 函 数 首先 读 取 当 
前 余额 至 内 存 。 在 完成 一 些 其 他 工作 之 后 ， 转 回 党 试 UPDATE 命 令 。 它 规定 UPDATE 命 令 只 能 
应 用 于 带 有 给 定 账号 和 原始 余额 的 行 。 如 果 值 被 其 他 事务 修改 , UPDATE 命 令 不 会 修改 任何 行 。 
UPDATE 命 令 后 面 的 错误 测试 会 识别 修改 成 功 与 否 。 如 果 成 功 ， 程 序 完 成 并 退出 。 如 果 修 改 失 
败 ， 程 序 员 可 以 完全 控制 做 什么 。 在 这 种 情况 下 ， 应 该 回 到 开始 ， 获 取 修 改 后 的 余额 并 重新 
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尝试 。 为 了 安全 起 见 ， 应 该 增加 重新 尝试 的 计数 。 如 果 这 个 数 太 大 ， 那 么 程序 应 该 放弃 ， 发 
出 错误 信息 ; 现在 无 法 更 新 数据 。 








CREATE FUNCTION ReceivePayment ( 
AccountID NUMBER, Amount Currency) RETURNS NUMBER 
oldAmount Currency; 

testEnd Boolean = FALSE; 
BEGIN 
DO UNTIL testEnd = TRUE 
BEGIN 

SELECT Amount INTO oldAmount 

WHERE AccountNumber = AccountID; 
















UPDATE Accounts 


SET AccountBalance = AccountBalance 一 Amount 
WHERE AccountNumber = AccountID 
AND Amount = oldAmount; 
COMMIT; 
IF SQLCODE = 0 And nrows > 0 THEN 
testEnd = TRUE; 
RETURN 0; 
END IF 





-~-keep a counter to avoid infinite loops 
END 






图 7-20 使 用 SQL 的 乐观 并 发 控制 。 在 内 存 中 保存 初始 值 ， 只 有 值 未 改变 才 做 
更 新 。 如 果 在 这 个 事务 完成 之 前 ， 另 一 个 事务 修改 了 数据 ， 返 回 ， 得 
到 新 值 ， 重 新 开始 


即使 涉及 多 个 分 布 式 数据 库 的 事务 ， 这 种 方式 仍然 有 效 。 但 是 ， 它 要 求 程序 员 对 每 个 更 新 
编写 并 验证 合适 的 代码 。 因 此 ， 有 必要 创建 代码 库 ， 包 含 可 以 为 儿 乎 所 有 事务 调用 的 通用 
UPDATE 命 令 。 

这 种 做 法 的 另 一 个 优势 在 于 程序 代码 可 以 包含 相对 自动 处 理 通 用 更 新 问题 更 精确 的 分 析 。 
在 这 个 例子 中 ， 悲 观 锁 几 乎 必然 停止 事务 ， 要 求 办 事 员 或 顾客 稍 修 再 试 。 另 一 方面 ， 乐 观 锁 
知道 仅仅 获取 新 的 余额 重新 计算 即 可 。 设 有 交互 ， 也 几乎 没有 延迟 。 


7.7 事务 的 ACID 特征 


完整 性 是 数据 库 的 基本 概念 。 使 用 数据 库 的 优点 之 一 是 DBMS 有 工具 管理 常见 的 问题 。 在 
事务 方面 ， 很 多 概念 可 以 总 结 为 缩写 的 ACID。 图 7-21 展 示 这 个 词 的 含义 。 原 子 性 (Atomicity) 
代表 核心 问题 ， 事 务 的 所 有 操作 要 么 全 部 成 功 ， 要 么 全 部 失败 。 一 致 性 (Consistency) 的 意 
思 是 数据 库 的 所 有 数据 必须 最 终 保持 一 致 。 即 使 事务 进行 中 存在 暂时 的 不 一 致 ， 数 据 库 最 终 
必须 回 到 一 致 状态 。 这 种 情况 必须 能 够 用 定义 的 应 用 程序 代码 检验 。 例 如 ， 事 务 结束 时 必须 
实现 参照 完整 性 。 扬 离 性 (Isolation) 的 意思 是 阻止 并 发 访问 问题 。 一 个 事务 的 修改 不 会 导致 
其 他 事务 的 错误 。 注 意 事务 很 少 做 到 完全 隔离 ， 它 们 可 能 需要 处 理 翡 观 或 乐观 锁 的 消息 。 持 
久 性 (Durability) 的 意思 是 提交 的 事务 是 永久 的 。 一 旦 事务 提交 了 修改 ， 即 保持 这 个 修改 。 


入 7 音 ”数据 庄 完 整 性 和 嘉 务 239 





这 个 概念 在 硬件 或 软件 失败 时 至 关 重 要 ， 对 于 分 布 式 数据 库 环 境 则 更 难保 证 。 大 部 分 系统 通 
过 把 修改 写 入 日 志文 件 保持 持久 性 。 这 样 ， 即 使 硬件 失败 中 断 了 更 新 过 程 ， 修 改 也 会 在 系统 
重新 启动 后 完成 。 需 要 注意 的 是 ， 如 果 接 受 了 COMMIT 语 句 ，DBMS 就 无 法 撤销 修改 。 


2 原子 性 : 所 有 的 修改 要 么 一 起 完成 ， 要 么 一 起 失败 
2 一 致 性 : 所 有 的 数据 保持 内 部 一 致 性 (提交 时 ) ， 可 以 通过 程序 合法 性 检验 


2 隔离 性 : 系统 给 每 个 事务 隔离 的 感觉 没有 并 发 访问 问题 
2 持久 性 : 事务 提交 以 后 ， 所 有 的 修改 永远 保存 ， 即 使 出 现 硬件 或 系统 故障 





图 7-21 事务 的 ACID 特征 。ACID 突 出 了 事务 的 四 个 主要 的 完整 性 要 求 


在 SQL99 中 ，START TRANSACTION 和 SET TRANSACTION 命 令 可 以 用 于 设置 隔离 等 级 。 
隔离 的 四 个 等 级 为 ，READ UNCOMMITTED、READ COMMITTED、REPEATABLE READ 
和 SERIAIZABLE。 这 些 等 级 可 以 用 于 阻止 不 同类 型 的 并 发 问题 ， 但 是 很 少 需要 中 间 等 级 ， 所 
以 很 多 系统 只 提供 第 一 个 和 最 后 一 个 。 

READ UNCOMMITED 等 级 几乎 不 提供 隔离 性 。 它 人 允许 程序 读 取 其 他 程序 正在 修改 、 还 没 
有 提交 的 数据 。 这 个 问题 有 时 叫做 脏 读 ， 因 为 收 到 的 数据 可 能 回 滚 ， 数 值 可 能 实际 上 不 准确 。 
如 果 选 择 这 个 等 级 ，SQL 不 允许 事务 更 新 任何 数据 ， 因 为 这 可 能 在 数据 库 中 传播 错误 数据 。 
READ COMMITTED 等 级 类 似 于 乐观 并 发 控制 。 它 会 阻止 事务 读 取 未 提交 的 数据 ， 但 是 数据 
仍然 可 能 在 第 1 个 事务 完成 之 前 被 另 一 个 事务 修改 或 删除 。 | 

REPEATABLE READ 等 级 阻止 正在 使 用 的 指定 数据 被 修改 或 删除 ， 但 是 没有 解决 幻影 问 
题 。 考 虑 一 个 事务 ， 如 果 商 品 的 价格 降低 但 在 某 个 选 定 区 域内 ， 则 计算 当前 的 总 数量 。 现 在 ， 
另 一 个 事务 降低 了 一 些 其 他 商品 的 价格 ， 使 得 它们 降低 到 选 定 的 范围 。 重 新 执行 第 一 个 命令 
或 使 用 同样 的 选择 条 件 创 建 另 一 个 命令 会 导致 分 析 另 外 的 (幻影 ) 数据 行 。 图 7-22 展 示 第 二 个 
事务 的 进程 可 以 导致 新 的 行 达 到 要 求 ， 所 以 第 一 个 事务 现在 操作 另 一 些 行 。 

SELECT SUM(QOH) 


FROM Inventory 
WHERE Price BETWEEN 10 and 20 





包含 在 第 1 UPDATE Inventory 
个 查询 中 SET Price = Price/2 
二 M WHERE . . . 
—” 
其 他 的 行 会 包含 
El 在 第 2 个 查询 中 
SELECT SUM(QOH) 
FR 


OM Inventory 
WHERE Price BETWEEN 10 and 20 
图 7-22 幻影 行 。 左边 的 事务 第 1 次 只 选中 3 行 数 据 。 第 2 个 事务 运行 时 ， 其 他 的 
行 符合 要 求 ， 这 样 第 2 次 执行 第 1 个 查询 时 会 返回 不 同 的 结果 
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SERIALIZABLE 隔 离 等 级 通过 保证 所 有 的 事务 如 同 按照 顺序 执行 一 样 ， 阻 止 幻 影 行 问题 。 
但 是 ， 记 住 这 个 结果 通常 是 通过 使 用 锁 得 到 的 ， 所 以 需要 数据 库 资源 ， 而 且 不 保证 事务 一 次 
执行 成 功 。 当 一 个 事务 被 另 一 个 事务 阻塞 时 ， 还 需要 错误 管理 机 制 捕获 并 解决 这 些 问 题 。 


7.8 码 生成 


现在 已 经 知道 ， 关 系数 据 库 与 主 码 关系 密切 ， 而 主 码 必 须 惟 一 。 在 商业 中 ， 保 持 主 码 一 直 
正确 的 生成 存在 困难 。 因 此 ， 大 部 分 关系 数据 库 有 一 个 生成 惟一 的 数字 码 的 机 制 。 虽 然 这些 
方法 对 于 简单 的 项 目 工作 良好 ， 但 生成 码 值 提 出 了 必须 用 程序 解决 的 挑战 。 而 且 ， 记 住 每 个 
DBMS 使 用 不 同 的 机 制 生成 码 。 

当 向 表 中 加 入 行 ， 然 后 把 相关 的 码 值 插入 另 一 个 表 时 ， 遇 到 码 生 成 的 主要 问题 。 例 如 ， 当 
加 入 新 的 顾客 时 ， 系 统 生成 CustomerID ， 需 要 把 这 个 值 插入 Order 表 。 图 7-23 显 示 基 本 的 问题 : 
为 新 顾客 生成 的 CustomerID 码 必须 在 事务 过 程 中 保存 ， 这 样 该 码 才能 插入 Order 表 。 当 然 这 两 
步 必 须 在 一 个 事务 中 。 尽 管 如 此 ， 不 同 的 生成 码 的 方法 使 得 这 一 问题 更 加 困难 。 


为 新 的 顾客 创建 订单 ， 


1. 生 成 CustomerID 的 新 码 
2. 向 Customer 表 插入 新 行 
3. 为 新 的 OrderID 创 建 码 
4. 向 Order 表 插入 行 





图 7-23 生成 的 码 。 为 新 的 顾客 创建 订单 ， 要 求生 成 CustomerID 码 ， 用 于 
Customer 表 ， 同 时 必须 保存 它 ， 这 样 才能 在 Order 表 中 使 用 


从 逻辑 上 讲 ， 可 以 通过 两 种 方式 生成 码 : (1) 当 新 行 加 入 表 时 ， 自 动 生成 ， (2) 独立 的 
码 生成 程序 。 第 一 种 方法 的 优点 是 把 新 行 加 入 初始 的 表 (Customer) 的 过 程 相 对 简单 。 缺 点 
是 难以 保证 得 到 第 二 张 表 中 可 用 的 正确 的 生成 码 。 第 二 种 方法 解决 了 第 二 个 问题 ， 但 是 使 得 
码 生 成 更 加 困难 ， 并 且 要 求 程序 员 保证 过 程 位 于 每 个 表 和 插入 操作 的 后 面 。 

如 图 7-24 所 示 ， 如 果 DBMS 自 动 为 每 个 表 生成 码 值 ， 代 码 看 起 来 相对 简单 。 复 杂 性 在 于 当 
两 个 事务 几乎 同时 在 同一 个 表 上 生成 新 的 码 值 时 会 门 i 
发 生 问 题 。 第 2 步 只 能 选择 最 近 生 成 的 码 值 。 如 果 2 获取 生成 的 码 值 
第 二 个 事务 在 步骤 1 之 后 在 同一 张 表 上 生成 码 值 ， | 3. 检 验 码 值 正确 性 
步骤 2 会 得 到 错误 的 值 ， 导 致 销售 订单 分 配给 错误 “| 《4 向 Order 表 插入 行 
的 顾客 。 为 了 安全 起 见 ， 代 码 需要 在 第 2 步 之 后 检 





图 7-24 自动 生成 码 。DBMS 自 动 生成 码 值 的 


验 码 值 正确 与 否 。 需 要 用 SELECT INTO 语 名 为 新 过 程 看 起 来 简单 。 但 是 ， 在 步 又 2 如 
创建 的 顾客 检索 顾客 数据 ， 然 后 比较 姓名 、 电 话 号 果 两 个 事务 几乎 同时 在 同一 张 表 上 
码 和 其 他 属性 。 另 一 种 方式 是 忽略 DBMS 码 值 ， 直 生成 新 的 码 值 会 发 生 什么 


接 使 用 SELECT 语句 通过 指定 每 个 顾客 属性 从 Customer 表 中 查找 码 值 。 使 用 这 种 方式 必须 保证 
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两 个 顾客 不 会 有 相同 的 属性 。 当 然 ， 顾客 可 能 重 名 。 但 是 他 们 的 地 址 和 电话 可 能 也 相同 吗 ? 
不 要 轻易 回答 这 个 问题 。 居 住 在 一 起 的 父子 两 人 如 何 ? aoe 
由 于 获得 自动 生成 码 值 的 困难 性 ， 第 二 种 调用 码 生 “| ?向 Customer 表 插入 行 
成 程序 的 方法 很 有 优势 。 图 7-25 表 示 为 新 顾客 创建 订单 | 3. 生 成 码 值 作为 OrderID 
的 基本 步 归 。 这 里 没有 码 生成 的 不 确定 性 。 生 成 程序 保 “| 4- 向 Order 插 入行 
证 码 值 惟一 一 一 即使 两 个 事务 同时 请 求 码 值 。 这 种 方法 
LN 人 图 7-25 码 生成 程序 。 步 骤 本 身 不 难 ， 
需要 码 值 的 地 方 。 每 个 表 和 每 个 需要 插入 数据 的 


7.9 数据 库 游标 本 


至 此 ， 所 有 的 过 程 和 函数 与 DML 语 名 或 单行 SELECT 语句 相关 。 这 些 语句 或 者 不 返回 值 ， 
或 者 只 返回 一 行 数据 。 这 个 限制 简化 程序 逻辑 ， 使 学 习 SQL 的 过 程 语言 更 容易 一 些 。 但 是 ， 有 
些 应 用 程序 需要 复杂 的 查询 : 返回 多 行 数据 的 SELECT 语 句 。 

回忆 SQL 命令 操作 数据 集合 一 一 一 次 多 行 。 如 果 希 望 更 精确 地 控制 该 怎么 办 ? 也 许 需要 一 
次 检查 一 行 执行 复杂 的 计算 ， 比 较 来 自 外 部 设备 的 数据 ， 或 者 向 用 户 显示 一 行 并 得 到 响应 。 
也 许 需要 把 一 行 数据 和 另 一 行 相 比较 。 例 如 ， 可 能 想 对 两 行 数据 做 差 。 用 标准 的 SQL 难以 完成 
这 些 工 作 。 


7.9.1 游标 基础 


SQL 能 够 一 次 一 行 地 遍历 数据 集合 。 创 建 数据 库 游 标 ， 它 定义 了 SELECT 语句 ， 并 且 一 次 
指向 一 行 。 可 以 通过 循环 语句 把 游标 移动 到 下 一 行 ， 对 于 查询 返回 的 每 一 行 反复 执行 代码 。 

图 7-26 展 示 在 Customer 表 上 创建 游标 和 循环 计算 拖欠 资金 总 数 的 基本 程序 结构 。 当 然 ， 这 
个 计算 使 用 简单 的 SELECT 语句 做 更 方便 快捷 。 这 里 的 目的 是 展示 实现 数据 库 游标 的 主要 代码 
结构 。DECLARE CURSOR 语 句 定义 检索 数据 行 的 SELECT 语句 。 虽 然 例子 中 只 使 用 一 列 ， 可 
以 使 用 任何 常见 的 包括 多 列 、WHERE 条 件 和 ORDER BY 行 的 SELECT 语句 。 必 须 打 开 
(OPEN) 游标 才能 使 用 ， 最 后 应 该 关闭 (CLOSE) 游标 释放 数据 库 资 源 。 当 游标 第 一 次 打开 
有 时， 它 直 接 指向 第 一 行 数据 之 前 。FETCH 语 句 检索 一 行 数据 ， 然 后 把 该 行 的 数据 列 存放 在 程 
序 变量 中 。 循 环 用 于 人 遍历 每 个 匹配 选择 条 件 的 行 。 


7.9.2 可 滚动 的 游标 


在 默认 情况 下 ，FETCH 命 令 获取 下 一 行 。 如 果 FETCH 命 令 把 游标 移动 到 数据 集 的 结尾 ， 
产生 一 个 错误 条 件 。 可 以 使 用 WHENEVER 语 句 捕获 这 个 错误 ， 或 者 检查 SQLSTATE 变 量 ， 看 
最 后 一 个 SQL 语句 是 否 产生 错误 。5 个 0 的 字符 串 表示 最 后 一 个 命令 成 功 。 

FETCH 命 令 有 多 个 功能 选项 ， 把 游标 移动 到 不 同 的 行 。 常 见 选 项 有 NEXT、PRIOR、 
FIRST 和 LAST。 它 们 获取 其 代表 的 行 。 图 7-27 列 出 一 个 游标 程序 ， 从 最 后 一 行 开 始 ， 向 上 移 
动 到 第 一 行 。 注 意 ， 必 须 用 SCROLL 关 键 词 把 游标 声明 为 可 滚动 的 。 当 然 ， 把 数据 按照 相反 的 
顺序 排列 ， 然 后 向 前 移动 效率 更 高 ， 但 是 这 里 为 了 展示 另 一 种 移动 方向 。 附 加 的 FETCH 滚 动 
选项 包括 移动 到 第 一 行 (FETCH FIRST) ， 以 及 跳 转 到 数据 集 的 特定 行 。 例 如 ，FETCH 
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ABSOLUTE 5 返回 数据 集 的 第 5 行 。 因 为 很 少 准 确 地 知道 返回 的 行 号 ， 相 对 滚动 选项 更 为 有 用 。 
例如 ，FETCH RELAITIVE--3 从 当前 行 向 后 跳 转 三 行 。 


DECLARE cursor] CURSOR FOR 
SELECT AccountBalance 
FROM Customer:; 
sumAccount, balance Curtency: 
SQLSTRATE Char(5) ; 
BEGIN 
sumAccount = 0; 
OPEN cursorl; 
WHILE (SQLSTATE = ‘00000’) 
BEGIN 
FETCH cursorl INTO balance; 
IF (SQLSTATE = ‘00000') THEN 
sumAccount = sumAccount + balance; 
END IF 
END 
CLOSE cursorl; 
--display the sumAccount or do a calculation 
END 





图 7-26 SQL 游标 结构 。 在 SQL 标准 中 ，DECLARE、OPEN、FETCH 和 CLOSE 
是 主要 的 语句 


DECLARE cursor2 SCROLL CURSOR FOR 
SELECT ... 

OPEN cursor2: 

FETCH LAST FROM cursor2 INTO ... 


Loop,.. 

FETCH PRIOR FROM cursor2 INTO ... 
End loop 
CLOSE cursor2; 





图 7-27 FETCH 选 项 。 可 滚动 的 游标 可 以 向 任何 方向 移动 。 这 段 代 码 移动 到 最 
后 一 行 ， 然 后 在 表 中 反 向 移动 。 其 他 的 FETCH 选 项 包括 FIRST、 
ABSOLUTE 和 RELATIVE 


在 行列 表 中 向 后 移动 暴露 了 另 一 个 事务 并 发 问题 。 如 果 在 一 些 行 上 工作 并 使 用 FETCH 
PRIOR 命 令 会 怎样 呢 ? 在 大 部 分 情况 下 ， 会 得 到 当前 行 的 前 一 行 。 但 是 ， 如 果 另 一 个 事务 在 
FETCH PRIOR 命 令 执 行 之 前 迅速 插入 新 的 一 行 会 发 生 什么 ?图 7-28 表 示 这 个 问题 。 代 码 已 经 
遍历 到 Carl， 但 是 另 一 个 过 程 向 列表 中 插入 Bob。FETCH PRIOR 命 令 返 回 Bob 的 数据 ， 而 不 是 
期 望 的 Alice 的 数据 。SQL 解 决 这 个 问题 的 标准 方法 是 使 数据 集 对 其 他 修改 不 敏感 。 在 游标 声 
明 中 加 入 关键 词 即 可 (DECLARE cursor3 INSENSITIVE CURSOR FOR…)。 实 际 上 ，DBMS 
把 查询 结果 复制 到 不 受 其 他 命令 影响 的 临时 表 里 。 虽 然 这 种 方式 可 行 ,但 它 极 大 地 消耗 数据 
库 资 源 。 相 反 ， 仔 细 考 虑 为 什么 需要 向 后 移动 。 在 大 部 分 情况 下 ， 这 并 不 是 必须 的 。 例 如 ， 
如 果 希 望 通过 当前 行 的 值 减 去 前 一 行 的 值 计算 差 值 ， 只 要 在 内 存 中 保存 前 一 行 的 值 ， 然 后 获 
取 下 一 行 ， 做 减法 即 可 。 不 需要 问 后 移动 ， 还 冒 出 错 的 风险 。 
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修改 后 的 数据 


程序 运行 时 加 
入 新 行 





图 7-28 游标 代码 中 的 并 发 事务 。 游 标 代码 已 经 在 数据 中 遍历 到 Carl。 然 后 试 
图 使 用 FETCH PRIOR 返 回 到 前 一 行 。 但 是 ， 如 果 其 间 另 一 个 事务 插入 
新 的 一 行 (Bob) ， 代 码 会 获得 这 一 行 ， 而 不 是 原来 的 《Alice) 
读者 可 能 注意 到 没有 在 查询 得 到 的 数据 集中 找到 某 一 行 ， 并 把 游标 移动 到 该 行 的 过 程 (类 
似 SEEK 命 令 )。 虽 然 有 的 系统 提供 这 个 功能 ， 但 是 很 少 使 用 。 相 反 ， 应 该 创建 WHERE 条 件 只 
搜索 想 要 的 行 。 


7.9.3 利用 游标 修改 或 删除 数据 


151,039 
基于 游标 的 程序 经 常 遇 到 的 情况 是 需要 修改 或 删除 当前 179.332 
行 的 数据 。 例 如 ， 图 7-29 展 示 创建 的 表 保 存 销售 数据 供 分 析 221 883 


使 用 。 标准 的 SELECT 命令 带 有 GROUP BY 子 句 可 以 计算 年 223,748 
度 销售 总 额 。 可 以 写 基于 游标 的 程序 计算 每 年 销售 的 增长 - 
(或 降低 ) 。 要 注意 的 是 ， 需 要 把 计算 后 的 值 保存 到 表 中 。 为 ”图 729 销售 分 析 表 。 标 准 的 





SELECT 查询 可 以 计算 并 
了 做 到 这 一 点 ， 需 要 指定 游标 为 可 更 新 的 ， 然 后 用 UPDATE 保存 年 度 总 销售 ”现在 需 
语句 保存 当前 游标 指向 的 行 的 计算 值 。 图 7-30 表 示 执行 计算 要 写 基于 游标 的 程序 计算 
需要 的 主要 代码 。 与 前 一 年 相 比 的 销售 增长 


DECLARE cursorl CURSOR FOR 
SELECT Year, Sales, Gain 
FROM SalesTotal 
ORDER BY Year 
FOR UPDATE OF Gain; 
priorSales, curYear, curSales, curGain 
BEGIN 
priorSales = 0; 
OPEN cursor!l; 
Loop: 
FETCH cursorl INTO curYear, curSales, curGain 
UPDATE SalesTotal 
SET Gain = Sales 一 priorSales 
WHERE CURRENT OF cursorl]; 
priorSales = curSales; 
Until end of rows 
CLOSE cursoril; 
COMMIT; 
END 





图 7-30 更 新 用 游标 代码 。 声 明 中 FOR UPDATE 选 项 允许 修改 Gain 列 。WHERE 
CURRENT OF 语句 指定 游标 指向 的 行 
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注意 ， 游 标 声明 只 有 Gain 列 可 更 新 。 这 个 功能 稍稍 保护 数据 库 。 如 果 发 生 错误 ， 或 者 有 人 
以 后 修改 代码 ，DBMS 只 人 允许 修改 Gain 列 。 修 改 Year 和 Sales 列 会 引发 错误 。 另 一 个 重要 元 素 是 
WHERE CURRENT OF cursorl 语 句 。 这 个 条 件 指出 ， 修 改 当 前 获得 的 行 ， 或 者 游标 指向 的 行 。 
UPDATE 语 名 只 能 应 用 于 这 一 行 。 经 典 的 删除 当前 行 的 语句 是 DELETE FROM SalesTable 
WHERE CURRENT OF cursorl 。 


7.9.4 带 参 数 的 游标 


偶尔 需要 计算 更 多 动态 的 查询 ， 即 ， 想 根据 程序 中 的 某 个 变量 选择 一 些 特定 的 行 。 例 如 ， 
用 户 可 能 输入 价格 ， 或 者 程序 根据 其 他 的 查询 计算 价格 。 然 后 要 搜索 低 于 指定 价格 的 行 ， 并 
在 其 上 执行 一 些 计算 。 在 游标 查询 中 ， 可 以 输入 局 部 变量 作为 参数 。 图 7-31 展 示 参 数 化 游标 的 
基本 元 素 。 输 入 游标 的 SELECT 语句 的 变量 名 称 。 在 这 个 过 程 中 ， 可 以 给 这 个 变量 赋值 。 该 什 
可 能 来 自 于 其 他 变量 的 计算 ， 可 能 由 用 户 输入 ， 甚 至 可 能 是 从 另 一 个 游标 或 查询 中 检索 到 的 。 
当 参 数 化 游标 打开 时 ， 当 前 值 提交 给 了 查询 ， 以 便于 它 只 返回 符合 要 求 的 行 。 使 用 游标 的 参 
数 化 查询 提供 了 自动 响应 其 他 修改 的 动态 计算 数据 的 强大 功能 。 


DECLARE cursor2 CURSOR FOR 
SELECT ItemiD, Description, Price 
FROM Inventory 

WHERE Price < :maxPrice; 
maxprice Currency; 

BEGIN 


maxPrice = ... -~-from user or other query 
OPEN cursor2; --runs query with current value 
Loop: 
--Do something with the rows retrieved 
Until end of rows 
CLOSE cursor2; 
END 





图 7-31 参数 化 的 游标 查询 。 通 过 用 户 输入 、 计 算 或 其 他 查询 ， 代 码 设置 
maxPrice 值 。 当 该 游标 打开 时 ， 值 应 用 于 SELECT 语 句 ， 只 返回 匹配 的 行 


7.10 Sally 的 宠物 商店 的 存货 清单 


管理 库存 更 新 是 商业 数据 库 应 用 中 一 个 环 手 的 问题 。 在 很 多 情况 下 ， 员 工 需 要 知道 现 有 
某 种 商品 的 数量 。 员 工 可 能 查看 商品 重新 排序 ， 或 者 管理 者 可 能 想 知 道 哪些 商品 库存 过 多 、 
销售 不 畅 。 在 数据 库 系 统 中 决定 数量 有 两 种 基本 方式 。 第 一 种 ， 可 以 写 好 程序 ， 无 论 何 时 ， 
只 要 有 需要 ， 就 计算 当前 库存 数量 。 程 序 可 以 查看 每 个 商品 的 购买 和 销售 ， 获 得 当前 库存 量 。 
在 大 的 应 用 程序 中 ， 这 个 过 程 可 能 很 慢 。 第 二 种 方法 是 ， 保 持 当 前 库存 表 的 总 数 不 断 更 新 。 
每 当 发 生 商 品 买 进 或 卖 出 时 ， 该 值 必须 更 新 。 第 二 种 方式 可 以 快速 返回 总 数 ， 但 其 缺点 是 编 
程 稍 显 复杂 。 注 意 ， 两 种 方式 都 需要 调整 机 制 对 付 已 经 不 存在 的 库存 项 ， 用 会 计 的 婉转 术语 
即 “ 库 存 收 缩 ”。 

查看 Sally 的 宠物 商店 的 Merchandise 表 ， 如 图 7-32 所 示 ， 注 意 到 它 包 含 QuantityOnHand 列 ， 
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这 里 计划 使 用 第 二 种 计算 库存 的 方式 ， 并 为 每 个 商品 项 保存 一 个 更 新 的 总 数 。 从 根本 上 说 ， 
需要 三 组 程序 ; 一 组 管理 商品 购买 ， 一 组 管理 商品 卖 出 ， 一 组 根据 库存 实际 清点 调整 库存 收 
缩 。 调 整 程序 直截了当 ， 但 是 必须 保持 用 户 界面 简单 易 用 。 购 买 和 销售 的 程序 类 似 ， 所 以 这 
里 只 讨论 商品 销售 。 


Merchandise 





增加 买 人 的 商品 
减 去 卖 出 的 商品 
调整 收缩 





图 7-32 处 理 库 存 变化 。 当 商品 卖 出 时 ， 卖 出 的 数量 输入 到 SaleItem 表 。 这 个 值 
必须 从 Merchandise 表 的 QuantityOnHand 上 减 去 


当 某 项 商品 卖 出 时 ， 以 SaleID 和 ItemID 为 主 码 的 SaleItem 表 增加 新 的 一 行 。 该 行 包括 买 入 
的 商品 数量 ， 例 如 10 贸 狗 食 。 当 Saleltem 表 发 生变 化 时 ， 


Merchandise 表 的 总 数 必须 调整 。 图 7-33 展 示 Saleltem 表 Saleltem 

可 能 发 生 的 四 个 基本 变化 。 这 些 事件 可 能 并 不 直接 ， 所 Salep 

以 考虑 下 面 这 些 可 能 导致 它们 的 商业 行为 。 Suantlty 
1. 新 的 销售 记录 在 Saleitem 表 中 增加 一 行 ， 所 以 

QuantityOnHand 必 须 减 去 卖 出 的 数量 。 1 增加 一 行 
2. 记事 员 的 错误 或 顾客 想法 的 改变 都 会 导致 销售 记 2. 删 除 一 行 

录 或 商品 项 的 撤销 ， 所 以 从 Saleltem 表 中 删 去 一 行 。 任 何 SE 





已 经 从 QuantityOnHand 减 去 的 数量 必须 重新 加 入 总 数 。 


3. 商品 可 能 退回 ， 或 者 记事 员 可 能 改正 数量 。 数 量 的 ”图 7 33 Saleftem 事 件 、 受 商业 行为 级 


调整 必须 反映 到 QuantityOnHand 总 数 。 动 ，SaltItem 表 可 能 有 四 种 情 
4. 商品 项 可 能 存在 输入 错误 ， 所 以 记录 员 修 改 况 发 生 。 对 于 每 个 事件 ，Mer- 
ItemID。 原 始 ItemID 的 QuantityOnHand 必 须 重新 保存 ， chandise 表 的 QuantityOnHand 


新 ItemID 的 QuantityOnHand 必 须 相 应 减少 。 必须 更 新 

使 用 数据 库 触发 器 ， 整 个 过 程 不 太 复杂 。 如 果 使 用 没有 触发 器 的 DBMS ， 必 须 把 相应 代码 
插入 表单 ， 这 个 过 程 不 会 很 复杂 ， 但 是 需要 验证 每 个 表单 ， 保 证 其 中 含有 必须 的 代码 。 

增加 新 的 一 行 的 第 一 种 情况 比较 简单 。 图 7-34 展 示 了 数据 库 触发 器 所 需要 的 逻辑 。 只 需要 
一 个 UPDATE 语 句 ， 从 Merchandise 表 的 QuantityOnHand 中 减 去 新 输入 的 Quantity。 在 检查 或 整 
理 已 有 系统 的 代码 时 ， 应 该 确认 这 个 事件 已 经 正确 处 理 了 。 问 题 是 很 多 开发 者 忘记 其 他 事件 。 

处 理 删除 行 的 第 二 个 事件 不 比 插入 行 的 代码 复杂 。 图 7-35 展 示 了 需要 的 新 触发 器 。 从 
SaleItem 删 除 行 表明 该 商品 实际 上 没有 卖 出 。 因 此 ， 触 发 器 通过 把 Quantity 加 回 到 Quantity 
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OnHand 抵 消 销 售 的 影响 。 


CREATE TRIGGER NewSaleItem 
AFTER INSERT ON SaleItem 
REFERENCING NEW ROW AS newrow 
FOR EACH ROW 


UPDATE Merchandise 
SET QuantityonHand = QuantityOnHand 一 newrow.Quantity 
WHERE ItemID = newrow.1ItemID; 





图 7-34 新 销售 触发 器 插入 一 个 新 行 就 会 触发 减 去 最 新 输入 的 quantity 事 件 ， 该 
Quantity 是 从 QuantityQnHand 中 卖 出 的 数量 


CREATE TRIGGER DeleteSaleItem 

AFTER DELETE ON SaleItem 

REFERENCING OLD ROW AS oldrow 

FOR EACH ROW 
UPDATE Merchandise 
SET QuantityonHand = QuantityOnHand + oldrow.Quantity 
WHERE ItemID = oldrow.ItemID; 





图 7-35 删除 行 的 触发 器 。 该 触发 器 通过 把 Quantity 加 回去 抵消 原来 的 减少 


修改 数据 的 情况 更 为 复杂 。 需 要 考虑 当 Quantity 值 改变 时 意味 着 什么 。 假 定 某 个 商品 项 的 
QuantityOnHand 开 始 为 50 份 。 然 后 ， 为 10 的 Quantity 揪 入 SaleItem 行 。 触 发 了 播 入 触发 器 ， 减 
去 10 份 ，QuantityOnHand 剩 余 40 份 。 记 事 员 现在 把 Quantity 从 10 修 改 为 8。 因 为 少 卖 出 了 2 份 ， 
所 以 QuantityOnHand 需 要 调整 。 如 图 7-36 所 示 ， 理 解 调整 代码 的 最 简单 方式 是 认为 把 原来 的 10 
份 加 回去 ， 然 后 从 新 的 Quantity 中 减 去 8 份 。 最 终结 果 是 QuantityOnHand 为 42 份 。 


CREATE TRIGGER UpdateSaleItem 
AFTER UPDATE ON SaleItem 
REFERENCING OLD ROW AS oldrow 

NEW ROW AS newrow 
FOR EACH ROW 


UPDATE Merchandise 

SET QuantityOnHand = QuantityonHana 
+ oldrow.Quantity 一 newrow.Quantity 

WHERE ItemtD = oldrow.ItemID; 





图 7-36 更 新 Quantity 的 触发 器 。 如 果 Quantity 改 变 ， 必 须 把 原来 的 值 加 回去 ， 
再 减 去 新 值 
第 四 种 修改 描述 更 为 复杂 。 如 果 记 事 员 修改 ItemID 值 会 发 生 什 么 ?过 到 的 第 一 个 复杂 情况 
是 数据 库 触发 器 可 能 没有 独立 修改 每 一 列 的 事件 。 所 以 ， 必 须 把 ItemID 的 修改 与 前 面 处 理 
Quantity 修 改 的 代码 结合 在 一 起 。 此 外 ， 需 要 考虑 特有 的 步骤 。 开 始 时 ItemID 为 1 的 
QuantityOnHand 是 50， 然 后 输入 出 售 10 份 。 插 入 触发 器 把 QuantityOnHand 减 少 到 40 份 。 现 在 
记事 员 把 ItemID 从 1 改 为 11 。 这 意味 着 ItemID 为 1 的 商品 实际 上 没有 卖 出 ， 所 以 前 述 10 份 必须 加 
回 到 QuantityOnHand。 此 外 ，ItemID 为 11 的 QuantityOnHand 必 须 减 去 10 份 。 如 图 7-37 所 示 ， 这 
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个 触发 器 需要 两 个 独立 的 UPDATE 语 句 。 第 一 个 语句 的 WHERE 子 句 用 oldrow.ItemID ， 而 第 二 
个 用 newrow.ItemID 。 还 有 ， 仔 细 观 赛 两 个 SET 语句 。 第 一 个 加 上 oldRow.Quantity， 第 二 个 减 
去 newRow.Quantity。 这 个 差别 为 什么 重要 呢 ? 第 一 , 记事 员 可 能 把 Quantity 和 ItemID 一 起 修改 ， 
必须 保证 日 的 Quantity 用 于 旧 的 ItemID。 第 二 ， 更 重要 的 是 ， 即 使 ItemID 没 有 变化 ， 这 个 触发 
器 还 可 以 处 理 简 单 的 Quantity 修 改 。 假 设 ItemID 设 置 为 1 并 且 没 有 改变 。 开 始 QuantityOnHand 
为 50 份 ， 先 卖 出 10 份 ， 剩 下 当前 QuantityOnHand 为 40 份 。 浏 览 代码 ， 看 看 如 果 只 有 Quantity 从 
10 改 为 8 份 ， 它 是 如 何 工作 的 。 第 一 ， 旧 的 Quantity (10) 加 回 到 QuantityOnHand。 第 二 ， 减 
去 新 的 Quantity (8)， 库 存 变 为 42 份 。 这 个 过 程 和 图 7-36 所 示 的 一 样 ， 但 是 它 用 两 步 完 成 ， 而 
不 是 一 步 。 


CREATE TRIGGER UpdateSaleItem 
AFTER UPDATE ON SaleItem 
REFERENCING OLD ROW AS oldrow 
NEW ROW AS newrow 
FOR EACH ROW 
BEGIN 
UPDATE Merchandise 
SET QuantityonHand = QuantityOnHand + oldRow.Quantity 
WHERE ItemID = oldqrow.ItemID; 


UPDATE Merchandise 

SET QuantityOnHand = QuantityOnHand 一 newRow.Quantity 
WHERE ItemID = newrow.ItemID; 

COMMIT; 
END 





图 7-37 最 终 的 更 新 触发 器 。 如 果 ItemID 改 变 ， 必 须 重新 保存 原来 商品 项 的 总 
数 ， 并 且 从 新 的 ItemID 的 商品 项 上 减 去 新 的 数量 
现在 ， 可 以 为 购买 表 (OrderItem) 编写 同样 的 代码 。 逻 辑 相 同 。 但 是 ， 这 里 的 商业 规则 
稍微 复杂 一 些 ， 只 有 当 商 品 已 经 到 货 时 才 更 新 QuantityOnHand。 如 果 决 定 这 样 做 ， 主 要 的 初 
始 触 发 器 不 在 OrderItem INSERT 事 件 上 ， 而 是 在 MerchandiseOrder 表 的 UPDATE 事 件 上 。 让 触 
发 器 寻找 ReceiveDate 列 的 输入 ， 然 后 更 新 QuantityOnHand。 


小 结 


虽然 SQL 命令 功能 强大 ， 但 是 ， 有 时 候 需 要 过 程 语言 精确 控制 更 新 ， 或 连接 其 他 驱动 程序 
或 应 用 程序 。 根 据 DBMS 的 情况 ， 过 程 代码 可 以 位 于 模块 、 表 单 或 外 部 应 用 程序 。 数 据 库 触发 
器 是 过 程 代 码 的 重要 应 用 。 这 些 过 程 被 诸如 插入 、 更 新 或 删除 数据 等 数据 库 事 件 触发 ， 或 作 
为 响应 执行 。 触 发 器 可 以 用 于 增强 复杂 条 件 或 执行 商业 规则 。 例 如 ， 附 加 到 Inventory 表 的 
QuantityOnHand 的 触发 器 可 以 在 值 低 于 某 个 水 平时 自动 通知 供应 商 。 如 果 一 张 表 的 一 个 修改 
引起 触发 器 执行 ， 又 导致 其 他 表 的 改变 ， 还 可 能 触发 更 多 的 事件 ， 这 就 是 级 联 触发 器 。 多 级 
触发 器 难于 调试 ， 而 且 耗 费 大 量 的 服务 器 资源 。 

在 大 部 分 商业 操作 中 ， 事 务 是 必 不 可 少 的 应 用 。 它 们 表示 一 组 必须 同时 成 功 或 同时 失败 的 
修改 。 设 置 事务 的 开始 点 和 结束 点 是 应 用 开发 中 保护 数据 完整 性 的 重要 步 综 。 同 时 有 多 个 用 
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户 试图 修改 同一 个 数据 所 产生 的 并 发 访问 是 数据 库 完 整 性 的 另 一 个 严重 威胁 。 翡 观 锁 经 常用 
串 行 化 的 方法 保护 数据 ， 保 证 同一 时 刻 只 有 一 个 事务 可 以 看 见 数据 。 但 是 ， 大 量 的 锁 消耗 资 
源 ， 而 且 可 能 导致 死 锁 问题 。 乐 观 锁 假设 冲突 很 少 ， 但 是 必须 加 入 代码 管理 发 生 冲 突 的 情况 。 
缩写 ACID (原子 性 、 一 致 性 、 隔 离 性 和 持久 性 ) 有 助 于 理解 DBMS 为 保护 事务 的 完整 性 而 必 
须要 保证 的 主要 特征 。 

在 很 多 关系 数据 库 中 ， 码 生成 是 一 个 重要 步 又， 因为 很 难 相信 人 们 可 以 创建 具有 惟一 性 的 
标识 。 有 两 种 常见 的 码 生 成 方法 : (1) 当 一 行 加 入 表 时 ， 自 动 创建 ， (2) 根据 需要 提供 独立 
的 函数 生成 码 。 两 种 方法 都 有 复杂 性 。 自 动 生成 码 难以 获取 并 在 另外 的 表 中 使 用 。 码 生成 函 
数 要 求 程 序 员 为 每 张 表 和 每 个 插入 过 程 编写 代码 。 

数据 库 游 标 提供 了 一 种 用 程序 检索 查询 中 多 行 数据 并 且 一 次 一 行 逐 行 遍历 的 方法 。 游 标 指 
向 的 某 个 当前 行 可 以 由 程序 察看 、 修 改 或 删除 。 可 滚动 的 游标 允许 向 前 或 向 后 移动 ， 但 是 ， 
只 要 有 可 能 ， 应 该 尽量 沿 一 个 方向 移动 。 程 序 可 以 使 用 可 更 新 的 游标 修改 或 删除 当前 行 的 数 
据 。 程 序 可 以 使 用 带 参数 的 查询 动态 选择 符合 其 他 条 件 的 行 。 


Te 





关键 词 
原子 性 持久 性 悲观 锁 
级 联 触发 器 隔离 性 过 程 语言 
并 发 访问 隔离 等 级 串 行 化 
一 致 性 乐观 锁 事务 
数据 库 游标 持久 存储 模块 (PSM) 触发 器 
死 锁 

复习 题 

1. 为 什么 有 了 SQL 还 需要 过 程 语 言 ? 


2. 数据 触发 器 的 目的 是 什么 ? 

3. 描述 主要 数据 事件 的 顺序 。 

4. 表单 事件 的 目的 是 什么 ? 

5. 某 些 主要 表单 事件 是 什么 ? 

6. 什么 是 事务 ? 为 什么 必须 由 开发 者 定义 事务 ? 
7. 如 何 开始 和 结束 一 个 事务 ? 





8. 
9 
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悲观 锁 和 乐观 锁 有 哪些 区 别 ? 
为 了 处 理 乐观 锁 的 冲突 需要 加 入 什么 代码 ? 


10. 什么 是 事务 的 ACID 特征 ? 

11. 码 生 成 的 常用 方法 有 哪些 ? 

12. 如 何 获得 所 用 的 DBMS 最 近 生 成 的 码 ? 

13. 什么 是 数据 库 浒 标 ? 它 为 什么 重要 ? 

14. 使 用 数据 库 游标 修改 数据 的 程序 逻辑 是 什么 ? 


练习 


1 


1 


kt 


CD 


nn 少 


oa 


~ 


oo 


b= 


© 


写 一 个 提高 价格 的 函数 ， 以 参数 形式 接受 价格 输入 。 如 果 价 格 低 于 10 美 元 ， 增 加 10% 并 返 
回 。 如 果 价 格 在 10 美 元 和 100 美 元 之 间 ， 增 加 5%。 高 于 100 美 元 的 增加 2%。 用 查询 测试 该 
函数 。 


. 创建 表 ， 列 出 商品 种 类 和 该 种 商品 的 税率 。 例 如 ， 食 物 (0%)、 服 装 (3%)、 娱 乐 (10%)。 


写 一 个 以 种 类 和 价格 作为 参数 的 函数 ， 计 算 并 返回 应 收 的 税 款 。 


. 创建 一 个 数据 触发 器 ， 当 雇员 工资 改变 时 把 一 行 写 人 新 的 表 中 。 保 存 日 期 的 变化 、 雇 员 、 


原来 的 工资 和 新 的 工资 。 


. 创建 一 个 数据 触发 器 ， 禁 止 雇员 工资 涨幅 超过 50%。 
. 创建 一 个 数据 触发 器 (如 果 不 能 获得 触发 器 ， 也 可 以 创建 表单 代码 )， 当 商品 卖 出 时 ， 调 


整 当前 库存 数量 。 需 要 SaleItem 和 Item 表 。 


. 创建 传统 银行 账户 表 (AccountID 、CustomerID ，TransactionDate ，AccountType，Amount ) 。 


为 同一 个 人 添加 一 个 支票 账户 和 一 个 储蓄 账户 。 编 写 一 个 事务 程序 ， 安 全 地 把 一 笔 资金 从 
储 蔷 账户 转移 到 支票 账户 。 


. 创建 一 张 小 表 ， 并 且 建 立 表单 编辑 该 表 的 数据 。 编 写 程序 修改 表 中 的 值 。 设 置 表单 并 编写 


程序 ， 正 确 处 理 表 的 悲观 锁 。 


. 创建 一 张 小 表 ， 并 且 建 立 表单 编辑 该 表 的 数据 。 编 写 程序 修改 表 中 的 值 。 设 置 表单 并 编写 


程序 ， 正 确 处 理 表 的 乐观 锁 。 


. 创建 一 张 小 表 ， 使 用 生成 的 码 (例如 ，SaleOrder) 。 创 建 另 一 张 表 ， 包 括 该 列 作为 外 码 


(例如 ，OrderItem ) 。 编 写 程序 实现 第 一 张 表 输入 新 的 一 行 ， 然 后 用 生成 的 码 在 第 二 张 表 中 
增加 一 行 。 

创建 一 张 小 表 ， 列 出 每 个 月 的 销售 ， 其 中 包括 一 列 PercentChange。 编 写 一 个 基于 游标 的 程 
序 ， 在 表 中 循环 ， 计 算 和 前 一 个 月 相 比 的 变化 率 ， 并 把 该 值 保存 在 当前 行 。 

下 面 的 五 个 练习 用 一 个 数据 库 样 例 ， 创 建 下 面 的 表 : 

Customer (CustomerID, LastName, FirstName, Phone, City, 

AccountBalance) 

Payment (Payment1ID, CustomerID， DateReceived, Amount) 

Item(ItemIib, Description, ListPrice, QOH) 

Sale (SaleIbh, CustomerID， SaleDate) 

SaleItem(SaleIp, ItemID, Quantity, SalePrice) 

Shipping (City, Shipping) 
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11. 编写 程序 获得 所 有 的 销售 和 付款 ， 计 算 当 前 每 个 顾客 的 AccountBalance， 然 后 把 这 个 数据 
插入 Customer 表 。 

12. 假设 所 有 的 商品 初始 库存 为 200 份 。 编 写 程序 根据 总 销售 计算 并 保存 每 次 销售 后 实际 的 库 
存 数量 。 

13. 编写 程序 计算 星期 一 和 星期 二 的 销售 差别 。 

14. 根据 下 面 的 百分比 编写 程序 更 新 Shipping 表 : 
麦迪 还 2% 
纽约 3% 
旧金山 4% 
芝加哥 2% 

其 他 $% 

15. 创建 表单 ， 允 许 用 户 从 Shipping 表 中 选择 城市 ， 输 入 百分数 修改 运输 费用 ， 然 后 点 击 按钮 
保存 Shipping 表 的 更 改 。 

Sally 的 宠物 商店 

16. 创建 表单 ， 人 允许 管理 者 指定 当前 数量 比例 和 价格 下 降 率 。 编 写 程序 检查 每 件 商品 的 销售 
(全 年 )。 如 果 当 前 数量 除 以 该 商品 的 总 销售 小 于 指定 的 比例 ， 按 照 价格 比例 下 调 其 订 价 。 

17. 创建 表单 ， 通 过 文本 框 接受 用 户 输入 动物 种 类 和 价格 上 涨 率 。 当 用 户 点 击 按钮 时 ， 用 指定 
的 比例 更 新 所 有 给 定 种 类 的 动物 订 价 。 

18. 使 用 适当 的 查询 ， 编 写 程序 计算 每 种 动物 按 月 销售 收入 的 变化 。 例 如 ， 用 户 希 望 知道 和 一 
月 份 相 比 ， 二 月 份 猫 的 销售 变化 率 。 编 写 程序 计算 这 种 变化 ， 当 用 户 点 击 按钮 时 ， 把 结果 
保存 在 新 的 (临时 ) 表 中 。 然 后 显示 结果 图 表 。 

19. 编写 程序 ， 当 购买 商品 时 ， 尤 其 是 接收 日 期 已 经 确定 的 情况 下 ， 增 加 当前 数量 。 一 定 要 使 
用 事务 处 理 ， 因 为 当前 数量 还 可 能 被 销售 影响 。 

20. 宠物 商店 考虑 购买 扫描 器 用 于 结账 。 这 些 扫描 器 获得 每 件 扫描 商品 的 ItemIPD。 假 设 当 扫 描 
商品 时 ， 这 个 数据 会 触发 事件 。 编 写 这 个 事件 调用 的 数据 。 该 函数 应 该 创建 新 的 销售 记录 ， 
并 保存 卖 出 商品 的 数据 。 可 以 通过 创建 表单 模拟 扫描 触发 器 ， 该 表单 上 包含 选择 ItemID 的 
控件 和 激活 触发 器 的 按钮 。 

Rolling Thunder 自 行车 

21. 解释 Rolling Thunderi 订 单 如 何 工作 。 特 别 地 ， 为 什么 零件 选择 需要 代码 ? 概述 用 于 管理 零 
件 的 代码 逻辑 (不 要 简单 地 复制 代码 ， 用 几 旬 话 描述 每 个 主要 部 分 ) 。 

22. 描述 Rolling Thunder 系 统 如 何 估计 非 标准 型 号 自行 车 〈 例 如 ，18.5 英 寸 出 地 自行 车 ) 的 常 
见 规格 ( 顶 管 长 度 、 链 条 等 )。 

23. 有 的 州 不 对 运输 费 征收 销售 税 ， 而 有 的 则 征收 。 修 改 StateTaxRate 表 管理 这 个 问题 ， 并 输 
入 样本 数据 。 写 一 个 以 自行 车 价格 、 运 输 费 和 州 为 参数 的 函数 。 该 函数 返回 应 收 税 款 的 计 
算 结 果 。 

24. 编写 适当 的 代码 ， 当 收 到 新 的 购 货 时 增加 库存 零件 的 数量 。 一 定 要 管理 数值 的 修改 ， 控 制 
并 发 修改 ， 因 为 数据 还 可 能 在 销售 中 改变 。 

25. 创建 查询 ， 按 月 计算 每 种 类 型 的 销售 。 创 建 临时 表 保 存 该 数据 和 变化 率 。 编 写 程序 执行 查 
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询 ， 把 数据 放 在 表 中 。 然 后 用 基于 游标 的 程序 计算 销售 变化 率 。 

26. 编写 基于 事务 的 过 程 ， 增 加 一 个 接收 新 付款 并 更 新 Customer 表 的 BalanceDue 的 顾客 事务 。 

27. 创建 表单 ， 人 允许 管理 者 指定 库存 数量 值 、 年 份 和 价格 变化 率 。 编 写 程序 降低 选中 年 份 之 前 
购买 的 ， 库 存 数量 大 于 指定 水 平 的 零件 的 价格 。 

28. 编写 程序 增加 某 个 欠 款 余额 的 顾客 账户 的 利息 费用 。 注 意 处 理 并 发 / 锁 问 题 。 

29. 编写 程序 ， 当 库存 数量 低 于 某 个 水 平时 ， 自 动 生 成 新 的 购买 订单 。 在 Component 表 中 增加 
ReorderPoint 列 ， 并 输入 样本 数据 。 
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第 8 章 


数据 仓库 和 数据 挖掘 





本 章 学 习 内 容 


。OLTP 系 统 和 OLAP 系 统 有 什么 区 别 ? 

。 什 么 是 数据 仓库 ? 

。OLAP 查 询 和 传统 查询 为 什么 不 同 ， 怎 样 不 同 ? 
。 什 么 是 数据 挖掘? 


8.1 开发 漫谈 


Miranda:， 快 点 儿 ， 快 点 儿 。 加 油 ， 再 快 点 儿 ! 

Ariel: 什么 ? 你 在 训练 马拉松 ? 

Miranda: 不 是 。 是 他 们 让 我 写 的 这 些 查询 ， 好 像 永 远 也 运行 不 完 。 我 用 少量 数据 测试 
时 还 好 好 的 。 可 现在 呢 ， 真 搞 不 懂 。 

Ariel， 或许 你 只 是 需要 一 台 更 快 的 计算 机 。 

Miranda， 不 ， 我 觉得 是 需要 一 个 不 同 的 系统 。 这 些 查询 正在 获取 数据 ， 但 这 些 数据 来 
自 很 多 不 同 的 表 。 并 且 那 些 经 理想 要 所 有 这 些 奇怪 的 小 计 。 

Ariel， ” 哇 ! 总 计 有 很 多 啊 。 你 怎 能 让 人 去 读 那些 东西 ? 我 想 我 在 一 张 纸 上 看 到 了 四 
张 不 同 级 别 的 总 计 ! 

Miranda， 是 啊 ， 那 只 是 经 理 们 想 要 的 一 部 分 。 我 很 高 兴 他 们 使 用 这 个 系统 ， 但 我 不 认 
为 这 些 报告 对 他 们 有 什么 意义 。 我 想 可 能 需要 一 个 独立 的 系统 来 重新 组 织 数 
据 并 给 经 理 们 生成 这 些 报表 。 那 时 他 们 会 想 再 做 一 些 统计 分 析 。 


8.2 简介 


关系 数据 库 系 统 的 设计 目标 是 有 效 存储 大 量 数据 ， 特 别 是 它们 可 以 快速 存储 和 提取 事务 数 
据 。 看 Sale 和 Saleitem 表 ， 你 会 发 现 数据 存放 得 很 紧 次 。 例 如 ， 宠 物 商店 的 SaleItem 表 只 有 4 列 ， 
并 且 都 含有 简单 数字 。 一 笔 单独 的 销售 可 以 快速 记录 或 提取 。 但 是 ， 这 种 结构 却 对 其 他 类 弄 
的 查询 带 来 问题 。 那 些 涉及 多 个 表 的 查询 会 用 JOIN 这 个 可 能 需要 DBMS 从 数 百 万 行 记录 中 匹 
配 数 据 值 的 操作 。 让 DBMS 分 析 数 据 ， 通 过 对 若干 个 不 同 的 因素 (如 雇员 、 地 域 、 产 品 分 类 和 
月 份 ) 计算 部 分 和 。 即 使 在 速度 很 快 的 硬件 上 ， 计 算 涉及 许多 因素 、 多 张 表 及 数 百 万 行 数据 
时 也 可 能 造成 性 能 问题 。 数 据 库 系 统 的 卖家 试图 通过 创建 表 的 索引 来 解决 其 中 一 些 问题 。 索 
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引 可 以 充分 提高 DBMS 在 一 个 表 中 寻找 单独 几 行 的 速度 ， 尤 其 提高 了 连接 运算 的 性 能 。 尽 管 如 
此 ， 还 是 存在 一 个 折 中 : 给 一 个 表 添 加 索引 加 速 了 查询 ， 但 是 降低 了 数据 更 新 的 速度 ， 因 为 
必须 不 断 地 重建 索引 。 这 种 冲突 已 经 导致 了 人 们 集中 利用 现 有 的 关系 数据 库 系统 做 联机 事务 
处 理 (OLTP)， 而 采用 含有 不 同 存储 和 提取 系统 的 新 系统 做 联机 分 析 处 理 (OLAP)。 从 OLTP 
中 提取 并 过 证 数据 ， 然 后 放 到 数据 仓库 中 。 数 据 仓 库 是 密集 索引 的 ， 并 为 提取 和 分 析 做 了 优 
化 。 还 有 一 些 附 加 的 过 程 或 例 程 可 以 用 来 分 析 数据 、 支 持 经 理 们 的 交互 式 探索 以 及 统计 性 的 
查找 有 意义 的 关联 信息 。 由 于 OLAP 技 术 还 在 发 展 中 ， 所 以 几乎 没什么 标准 约束 ， 并 且 有 大 量 
的 工具 可 用 。 


8.3 索引 


尽管 报表 常常 看 作 行 和 列 的 简单 排列 ， 可 是 DBMS 却 不 能 简单 地 把 所 有 数据 都 存放 到 顺序 
”文件 中 。 硕 序 文件 的 查找 时 间 太 长 ， 并 需要 大 量 的 操作 才能 给 数据 中 插入 新 行 。 观 察 图 8-1 中 
关于 雇员 的 一 个 简短 表格 ， 考 虑 要 找到 EmployeeID 是 7 的 那 一 行 需要 的 步骤 。DBMS 必 须 顺 序 
地 读 取 每 一 行 并 检查 ID， 直 到 找到 一 个 合适 的 匹配 。 在 这 个 情况 下 ， 需 要 读 取 7 行 。 平 均 情况 
下 ， 如 果 总 共有 N 行 ， 则 找到 一 个 匹配 大 约 需 要 查找 N/2 行 。 如 果 有 一 百 万 行 ， 一 个 典型 的 查 
找 将 需要 读 取 500 000 行 ! 显然 ， 这 种 方法 对 大 数据 集 是 行 不 通 的 。 如 果 需 要 保持 列表 有 序 ， 
则 给 数据 中 插入 新 行 的 情况 就 更 加 糟糕 。 系 统 需要 先 读 取 数 据 的 每 一 行 直到 给 新 行 找到 一 个 
位 置 ， 然 后 再 继续 读 剩 下 的 每 一 行 ， 把 它们 复制 到 下 一 行 去 。 而 删除 事实 上 是 比较 容易 的 ， 
因为 DBMS 并 不 真 移 除数 据 。 它 只 是 简单 地 把 一 行 标记 为 已 删除 。 随 后 ， 数 据 库 可 以 重新 组 织 
或 者 压缩 ， 移 去 这 些 标记 的 空间 。 


|_ ID | LastName | FirstName | DateHired _ 







1 Reeves | ket | 1/29/2004 | 
[ab [Bn | /31/2004 
3 | Reasoner [Kay | 2/17/2004 | 
nop wav | 2/8/2004 | 
sames | iesha [16/2004 | 
[eaton [Anissa | 8/23/2004 | 
Ea 


| Dustin | 
| 8 | Carpenter | Carlos | 12/29/2004 | 
| 9 | O'Connor | Jessica | 7/23/2004 | 
| 10 | Shields | Howard | 7/13/2004 | 


图 8-1 在 顺序 表 中 找到 某 一 项 。 即 使 知道 主 码 值 ， 系统 还 是 必须 从 第 一 行 开始 ， 
直到 找到 想 要 的 匹配 。 平 均 情况 下 ， 如 果 总 共有 N 行 ， 则 找到 一 个 特定 
项 需要 N/2 行 数据 读 取 





7 [ars | 





8.3.1 二 分 查找 


观察 图 8-1 中 的 数据 ， 显 然 DBBMS 没 有 利用 到 所 有 的 信息 。 特 别 地 ， 如 果 数 据 行 是 有 序 的 ， 
则 有 一 个 快 得 多 的 查找 方法 。 图 8-2 展 示 怎 么 利用 这 个 有 序 信息 。 考 虑 一 下 查找 一 个 纸 质 的 词 
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典 或 者 电话 本 的 过 程 。 不 是 从 第 一 页 开始 看 每 一 项 ， 而 是 ， 先 翻 到 书 中 间 ， 然 后 根据 你 在 中 
间 找 的 名 字 决 定 查找 书 的 前 一 半 还 是 后 一 半 。 
找到 的 中 间 项 是 Goetz， 你 就 知道 Jones 在 数据 
的 后 一 半 。 通 过 一 次 查找 ， 你 的 查找 范围 立即 
缩小 为 原来 的 二 分 之 一 。 继 续 同样 的 过 程 ， 每 
次 把 余下 的 部 分 分 成 两 半 ， 然 后 只 查找 合适 的 
部 分 。 在 这 个 例子 中 ， 只 需要 4 次 尝试 就 可 以 找 
到 Jones。 这 种 二 分 查找 过 程 持 续 地 把 剩 下 的 部 
分 分 成 两 半 ， 直 到 找到 想 要 的 行为 止 。 一 般 地 ， 
如 果 总 共有 N 行 ， 二 分 查找 将 最 多 需要 m = 
log: (N) 次 尝试 就 可 以 找到 需要 的 行 。 理 解 这 
个 公式 的 另 一 种 想法 就 是 ， 每 次 把 列表 砍 去 一 
半 ， 所 以 需要 砍 m 次 (2m = 入 )。 现 在 考虑 一 个 一 ”图 8-2 二 分 查找 。 为 了 找到 Jones 这 一 项 ， 把 列 





全 _ se 表 分 成 两 份 。Jones 落 在 值 (Goetz) 的 后 
百 万 行 的 数据 ， 想 找 到 其 中 一 项 最 多 需要 读 多 面 ， 所 以 把 第 二 部 分 再 分 成 两 部 分 
少 行 ? 这 里 ，m 的 值 是 20， 显 然 要 比 平均 500 000 Jones 又 落 在 了 Kalida 的 前 头 。 继 续 把 剩 下 
次 的 顺序 方法 要 好 得 多 。 的 部 分 分 成 两 半 ， 直 到 找到 匹配 的 行 
8.3.2 指针 和 索引 


当 要 查找 的 数据 表 有 序 时 ， 二 分 查找 是 一 个 相对 不 错 的 方法 ， 所 以 用 主 码 查找 就 很 说 得 过 
去 ， 这 在 表 的 连接 中 很 常见 。 但 如 果 主 码 是 一 个 数值 的 CustomerID (客户 ID ) ， 而 想 按 
LastName ( 姓 ) 来 查找 ， 情 况 又 如 何 ? 表 又 怎 能 按照 多 种 方式 排序 ? 答案 就 在 索引 和 指针 中 。 

数据 实际 上 并 不 存放 在 表 里 。 通 常数 据 都 是 分 块 存储 在 特殊 文件 中 。 存 储 时 ， 每 一 块 (也 
许 就 是 一 行 ) 放 到 一 个 地 方 ， 得 到 一 个 地 址 。 这 个 地 址 就 是 能 准确 告诉 操作 系统 数据 在 哪里 
存放 的 一 个 指针 。 这 大 概 就 和 “指明 从 一 个 文件 开始 的 偏 移 字 节 ” 的 偏 移 量 一 样 简单 。 图 8-3 
表示 可 以 利用 被 查找 的 列 〈ID 或 LastName) 和 地 址 指针 来 创建 索引 。 这 种 索引 是 独立 的 ， 并 
且 已 被 排序 ， 所 以 可 以 快速 访问 。 只 要 找到 了 合适 的 索引 项 ， 地 址 指针 就 会 传 给 操作 系统 ， 
那么 对 应 的 数据 也 就 立即 提取 出 来 了 。 实 际 上 ， 即 使 索引 也 不 是 顺序 存储 的 。 它 们 通常 都 会 
像 B 树 那样 成 块 存储 。 查 找 B 树 至 少 可 以 和 二 分 查找 一 样 快 ， 并 且 插 入 和 删除 码 值 还 变 得 相对 
简单 了 。 可 以 在 SQL 中 用 CREATE INDEX 命 令 创建 索引 。 


8.3.3 位 图 索引 和 统计 方法 


一 些 数据 库 厂商 为 大 的 表 提供 高 度 压 缩 的 位 图 索引 。 在 位 图 索引 中 ， 每 个 数据 码 都 编码 成 
少量 的 “位 ”集合 。 整 个 索引 的 位 图 (二 元 ) 图 像 通常 小 到 能 够 装 进 RAM 中 。 高 速 的 位 操作 
用 来 比较 和 查找 码 值 。 因 此 ， 位 图 索引 非常 快 。 对 于 像 次 码 那 种 包含 大 量 重 复数 据 的 列 ， 位 
图 索引 尤其 有 用 。 位 图 索引 不 应 用 于 包含 所 有 惟一 值 的 列 。 例 如 ， 在 一 个 典型 的 SaleItem 
(SaleID，ItemID，Quantity) 表 中 ， 你 可 能 会 考虑 为 SaleID 和 ItemID 列 创建 位 图 索引 。 但 是 你 
大 概 不 会 想 着 给 Sale 表 的 SaleID 列 创建 位 图 索引 。 








5 烧 反 人 入 和 米 据 花白 255 





Lastiame Firsthame DateHired 


Carpenter Carios 12/29/2001 
O'Connor Jessica 7/23/2001 
Shields Howard 7/13/2001 


1 Reeves Keith 1/29/2001 
2 Gibson B 计 3/31/2001 
3 Reasoner Katy 2/17/2001 
4 Hopkins Alan 2/8/2001 
5 James Leisha 1/6/2001 
6 Eaton Anissa 8/23/2001 
7 Farris Dustin 3/28/2001 
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图 8-3 指针 和 索引 。 每 块 数据 都 存 到 一 个 有 着 特定 地 址 的 位 置 。 索 引 包 括 了 要 
查找 的 列 值 以 及 指向 这 行 其 他 部 分 的 指针 。 可 以 给 一 个 表 创 建 多 个 索引 ， 
以 便 进 行 快速 查找 
一 些 数据 库 系 统 还 提供 更 为 复杂 的 索引 方法 。 这 些 方法 在 素 引 列 里 检查 数据 ， 并 存储 数据 
结构 方面 的 统计 信息 。 例 如 ， 主 码 在 一 个 主 表 中 是 惟一 的 。 但 是 外 码 可 能 在 一 个 表 中 出 现 多 
次 。 举 个 例子 ，CostomerID 中 值 1173 在 Costomer 表 中 只 出 现 一 次 ， 但 在 Sale 表 中 出 现 多 次 (每 
个 Sale 一 次 )。 如 果 DBMS 知 道 一 个 表 中 哪个 值 出 现 的 最 频繁 ， 就 可 以 使 用 这 些 统计 信息 更 为 
有 效 地 查找 数据 。 如 果 能 知道 WHERE 条 件 中 的 某 一 个 条 件 只 会 产生 一 个 表 中 有 限 的 几 个 匹配 ， 
就 可 以 先 使 用 那个 条 件 ， 再 把 结果 和 其 他 表 做 连接 就 简单 得 多 、 也 快 得 多 了 。 


8.3.4 索引 的 问题 


考虑 一 个 定义 了 10 个 索引 的 表 。 当 一 个 新 的 数据 行 添加 进 表 中 时 ， 每 个 索引 都 得 改动 。 
最 少 也 需要 数据 库 在 10 个 索引 中 都 插入 新 行 。 大 部 分 情况 都 需要 重新 组 织 每 个 索引 。 这 个 问 
题 是 决定 如 何 提高 应 用 性 能 的 核心 问题 。 通 过 创建 索引 ， 显 著 提 高 查找 数据 表 的 能 力 。 但 对 
于 创建 的 每 一 个 索引 ， 每 次 添加 新 数据 或 修改 索引 列 时 ， 应 用 程序 都 会 变 慢 。 所 以 ， 在 哪些 
列 创建 索引 是 你 的 重要 抉择 。 

抉择 的 第 一 步 是 只 索引 需要 随机 查找 的 列 。 最 重要 的 列 是 在 主要 查询 中 参与 表 连 接 的 列 。 
可 以 确定 应 用 中 哪些 查询 最 为 常用 。 其 次 ， 索 引 那 些 JOIN 条 件 中 用 到 的 列 。 然 而 ， 为 了 安全 
起 见 ， 同 样 需 要 确定 那些 要 频繁 改动 的 表 。 把 那些 表 的 索引 尽 可 能 多 地 移 走 。 第 三 步 ， 用 大 
基 的 样本 数据 和 繁重 的 查询 来 测试 应 用 程序 。 找 那些 反应 较 慢 的 部 分 或 表单 。 然 后 检查 看 有 
了 索引 是 不 是 能 提高 访问 速度 。 测 试 索引 和 整个 应 用 看 是 否 和 其 他 部 分 接口 良好 。 在 应 用 的 
关键 部 分 ， 只 有 当 索 引 清晰 、 显 著 地 提高 了 性 能 时 才 使 用 它 。 第 四 ， 或 许 也 是 最 重要 的 步骤 ， 
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是 找 一 个 针对 你 使 用 的 DBMS 的 性 能 分 析 工 具 。 一 个 好 的 分 析 器 可 以 监控 使 用 ， 确 定 瓶颈 ， 并 
且 给 出 哪些 列 应 该 索引 的 建议 。 


8.4 数据 仓库 和 联机 分 析 处 理 


最 终 ， 索 引 的 折 中 与 平衡 是 难以 确定 的 。 为 了 实现 复杂 的 查找 ， 每 张 表 需 要 很 多 索引 。 但 
是 过 多 的 索引 叉 会 降低 事务 处 理 的 速度 。 考 虑 一 个 典型 的 企业 ， 它 在 若干 个 不 同 的 数据 库 
(有 时 还 有 一 些 文件 ) 中 存储 数据 。 显 然 ， 事务 系统 需要 较 高 的 优先 级 ， 否 则 商业 活动 将 无 法 
运转 ,但 经 理 们 却 需要 越 来 越 复 杂 的 数据 分 析 。 解 决 方法 是 ,保留 事务 系统 ， 并 为 经 理 们 创 
建 一 个 新 的 数据 库 来 执行 联机 分 析 处 理 。 

渐渐 地 ， 相 比 OLTP 系 统 生 成 的 传统 报表 ， 经 理 们 需要 更 多 的 信息 。 他 们 希望 能 交互 式 地 
检查 数据 。 他 们 并 不 总 是 知道 该 问 哪 些 问题 或 者 要 找 些 什 么 ， 他 们 需要 从 多 个 不 同 角度 快速 
观察 数据 。 这 类 查询 可 能 涉及 海量 的 数据 和 多 张 表 的 JOIN 运算 。 幸 运 的 是 ， 这 种 访问 几乎 总 
是 只 读 的 ， 只 有 极 少 的 数据 被 修改 ， 而 只 读 查 询 比 更 新 查询 快 许多 倍 。 但 是 涉及 几 百 张 表 和 
数 百 万 行 记录 的 数据 连接 还 是 需要 时 间 的 。 而 且 ， 像 索引 那些 加 速 查询 的 技巧 又 会 减缓 事务 
处 理 的 速度 。 


8.4.1 数据 仓库 的 目标 


许多 组 织 选 择 通过 创建 一 个 数据 库 的 副本 来 避免 这 些 冲 突 。 数 据 仓库 在 一 个 致力 于 回答 管 
理性 查询 的 特殊 数据 库 中 持 有 一 份 事务 数据 的 副本 。 数 据 可 能 从 多 个 不 同 的 源 而 来 ， 但 所 有 
数据 都 被 过 滤 ， 以 保证 其 一 致 性 并 达到 参照 完整 性 约束 的 要 求 。 每 张 表 上 建立 多 个 索引 ， 提 
高 JOIN 运算 的 性 能 。 数 据 仓库 还 同时 包括 了 特殊 功能 和 查询 控制 ， 用 以 快速 创建 数据 的 不 同 
视图 。 通 常 ， 每 天 一 次 或 两 次 ， 数 据 由 事务 系统 中 转换 过 来 ， 大 批量 存 人 数据 仓库 。 另 外 ， 
数据 仓库 可 能 是 非 规范 化 的 ， 这 样 ， 用 数据 的 重复 来 改善 查询 性 能 。 

数据 仓库 的 基本 概念 由 图 8-4 给 出 。 事 务 数据 库 持续 地 收集 数据 并 生成 基本 报表 ， 例 如 库 
存 和 销售 报表 。 数 据 仓库 表示 数据 的 一 个 独立 的 集合 。 尽 管 可 能 使 用 同一 个 DBMS ， 但 也 需要 
新 的 表 。 例 行 的 程序 是 ， 数 据 从 事务 数据 库 和 其 他 文件 中 被 抽取 出 来 ， 然 后 通过 检查 以 确保 
一 致 性 。 例 如 ， 所 有 的 码 值 都 必须 匹配 参照 完整 性 。 然 后 加 到 数据 仓库 中 ， 而 且 通常 并 不 以 
规范 化 的 表 来 存储 。 相 反 ， 它 是 类 似 于 星 形 模式 的 特殊 结构 。 这 些 情 况 下 ， 数 据 常常 是 重复 
的 。 比 如 ， 同 样 的 城市 和 州 名 的 结合 在 数据 记录 中 会 出 现 上 千 次 。 

联机 分 析 处 理 通常 和 数据 仓库 相关 ， 但 从 技术 上 讲 ， 不 使 用 中 间 媒 介 的 数据 仓库 ， 可 以 在 
事务 数据 库 上 构建 OLAP 系 统 。OLAP 是 一 个 比较 新 的 术语 ， 具 体 包含 哪些 特性 有 着 不 同 的 说 
法 。 更 要 紧 的 是 每 个 卖家 都 提供 不 同 的 技术 和 不 同 的 实现 。 通 常 来 讲 ，OLAP 包 含 一 系列 的 工 
具 ， 令 分 析 和 比较 数据 库 中 的 数据 变 得 更 加 简单 。 

数据 仓库 一 旦 完成 ， 就 有 许多 查找 它 的 工具 。 一 些 人 可 能 使 用 基本 的 SQL 查询 并 逐渐 改善 
他 的 查询 。 其 他 人 可 能 使 用 电子 数据 表 提 取 和 分 析 数 据 。 更 高 级 的 方法 使 用 数据 挖掘 技术 。 
数据 挖 所 由 一 些 在 数据 中 查找 隐 含 模式 的 自动 工具 组 成 。 一 些 工具 包括 统计 方法 【例如 回归 
分 析 、 判 定式 分 析 ) ， 模 式 识 别 〈 例 如 神经 网 络 ) 以 及 数据 库 分 段 〈 例 如 ，k 平 均 、 混 合 建 模 、 
偏离 分 析 ) 。 这 些 工具 通常 需要 充分 的 计算 能 力 和 极 高 速 的 数据 提取 。 即 使 有 当前 的 高 速 系统 ， 
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分 析 现 存 的 一 些 较 大 的 数据 集 时 ， 这 些 技术 中 的 许多 都 需要 数 天 或 数 周 。 关 键 问题 是 ， 如 果 
用 户 要 做 这 种 类 型 的 分 析 ， 数 据 库 就 必须 按 他 们 的 特殊 要 求 进行 配置 和 调整 。 


操作 数据 





图 8-4 数据 仓库 。 例 行程 序 是 : 从 OLTP 系 统 和 其 他 源 中 得 到 数据 ， 然 后 过 滤 ， 
再 转换 到 数据 仓库 中 去 。 数 据 仓库 为 交互 式 数据 分 析 做 了 优化 


8.4:2 数据 仓库 的 问题 


尽管 数据 库 管 理 系统 在 进步 , 计算 机 硬件 也 在 不 断 发 展 , 一 些 查 询 还 是 需要 运行 很 长 时 间 。 
很 多 公司 都 有 一 些 数据 是 以 不 同 的 名 字 和 格式 存在 不 同 的 数据 库 中 ， 甚 至 存在 老 文 件 中 。 数 
据 仓 库 的 目标 就 是 创建 一 个 系统 以 特定 的 间隔 收集 这 些 数据 ， 进 行 清洗 以 确保 其 一 致 性 ， 然 
后 存在 某 一 个 场地 。 数 据 仓库 的 次 要 目标 是 提高 OLAP 查 询 的 性 能 。 大 多 数 情况 下 ， 性 能 都 可 
以 通过 数据 非 规范 化 得 到 提升 。 表 连接 常常 是 一 个 查询 中 最 耗 时 的 部 分 ， 所 以 创建 新 的 数据 
结构 提前 做 好 所 有 这 些 连接 ， 并 把 元 余 的 数据 存储 到 更 少 的 一 些 表 中 。 

创建 数据 仓库 有 三 个 主要 的 挑战 : (1) 建立 一 个 收集 和 清洗 数据 的 传输 系统 ，(2) 当 处 
理 数 百 万 或 十 亿 行 数据 时 ， 设 计 能 够 获得 最 佳 查询 性 能 的 存储 结构 ， 和 (3) 创建 数据 分 析 工 
具 ， 来 统计 性 地 分 析 数 据 。 大 多 数 公 司 都 选择 为 第 三 步 购 买 数据 挖掘 软件 。 极 少数 公司 会 让 
有 经 验 的 程序 员 编 写 详 细 的 统计 分 析 程 序 ， 一 些 公司 还 销售 预先 打 好 包 的 能 够 用 来 配置 在 数 
据 中 查找 模式 的 工具 。 第 二 个 问题 一 OLAP 设 计 将 在 下 一 节 讨 论 。 

清洗 和 传输 数据 常常 是 建立 一 个 数据 仓库 最 困难 的 部 分 。 图 8-5 表 称 作 抽取 、 转 化 和 传输 
(ETT) 的 过 程 。 你 很 快 就 会 发 现 大 多 数 公 司 都 有 许多 不 同 的 数据 库 ， 含 有 不 同 的 表 和 列 名 以 
及 相同 类 型 数据 的 不 同 格 式 。 例 如 ， 一 个 数据 库 可 能 有 声明 为 20 个 字符 的 列 
Customers.LastName， 而 第 二 个 数据 库 则 使 用 设置 为 15 个 字符 的 Clients.LName。 从 这 些 数据 
源 中 抽取 数据 的 过 程 需要 尽 可 能 地 自动 ， 如 果 试 图 手工 来 清洗 数据 就 很 难 了 ， 代 价 也 太 高 。 
所 以 常常 为 从 不 同 的 源 中 合并 数据 编写 复杂 的 查询 。 在 这 个 小 例子 中 ， 很 可 能 导 人 一 个 表 
(例如 Customers) ， 然 后 运行 NOT IN 查询 来 获得 在 Clients 表 中 但 不 在 Customers 表 中 的 名 字 列 
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表 。 这 些 新 的 名 字 就 可 能 加 入 数据 仓库 。 一 些 DBMS 厂 商 创建 帮助 你 自动 进行 数据 对 比 的 导入 
工具 ,但 最 终 ， 大 多 数 公司 还 是 以 自己 写 代 码 来 处 理 这 种 复杂 的 过 程 而 告终 。 这 个 过 程 的 一 
个 关键 要 素 就 是 : 不 打 断 进行 中 的 操作 ， 从 OLTP 系 统 中 抽取 数据 。 这 一 步 常 常会 用 到 利用 了 
多 处 理 器 机 器 的 并 行 处 理 过 程 的 专用 工具 ， 但 其 细节 取决 于 DBMS、 硬 件 和 数据 库 配 置 。 


Customers 


把 client 转 化 

为 customer 

应 用 标准 的 

产品 编码 

转化 货币 

正 
门 一 一 全 区 域名 数据 仓库 ; 所 有 
来 自 不 同系 统 数据 都 必须 一 致 
的 事务 数据 





图 8-5 抽取 、 转 化 和 传输 (ETT) 。 事 务 数据 通常 必须 修改 得 完全 一 致 。 这 个 
过 程 必须 自动 ， 以 便 不 受 影响 地 调度 运行 

有 时 我 们 还 有 一 种 方法 来 降低 数据 容量 ， 那 就 是 只 抽取 和 传送 自 上 一 次 传送 以 来 改变 了 的 
数据 。 但 是 ， 这 个 过 程 需要 OLTP 系 统 跟踪 所 有 更 改 操作 的 日 期 和 时 间 。 许 多 老 系统 都 没 法 针 
对 所 有 元 素 记 录 这 些 信息 。 例 如 ， 销 售 数据 库 必 须 记 录 一 次 销售 的 日 期 和 时 间 ， 但 很 可 能 不 
会 记录 一 个 客户 地 址 更 改 的 日 期 和 时 间 。 

转化 数据 常常 意味 着 替换 空 值 ， 从 文本 转向 数字 ， 或 在 连接 表 中 提取 值 并 在 基本 表 中 更 新 
值 。 所 有 这 些 操作 都 可 以 由 SQL 语句 来 处 理 ， 还 可 以 创建 能 在 日 常事 务 中 执行 的 模块 ， 用 来 提 
取 数 据 、 清 洗 数据 ， 并 把 它 插入 到 新 数据 库 中 。 


8.5 OLAP 的 概念 


对 OLAP 的 一 个 更 具体 的 表述 就 是 绝 大 部 分 工具 都 把 数据 描述 成 一 个 多 维 立 方 体 。 经 理 们 
使 用 不 同 的 工具 来 检查 数据 的 不 同方 面 。 为 了 展示 这 个 过 程 ， 考 虑 宠物 商店 数据 库 的 简单 例 
子 。 经 理 们 对 商品 销售 很 感 兴 趣 。 特 别 地 ， 他 们 希望 按 日 期 、 按 项 目的 类 别 ( 猫 、 狗 等 等 )、 
以 及 按 客户 的 所 在 地 来 观察 销售 。 他 们 想 度量 的 属性 就 是 销售 出 物品 的 价值 或 总 量 ， 也 就 是 
价格 乘 以 数量 。 图 8-6 展 示 这 种 小 型 查询 如 何 刻画 成 一 个 三 维 立方 体 。OLAP 工 具 使 经 理 们 可 
以 检查 包含 在 三 维 立 方 体 中 的 任何 问题 。 例 如 ， 他 们 可 以 快速 检查 按 州 、 城 市 、 类 别 或 月 份 
统计 的 总 量 。 他 们 可 以 看 到 每 个 州 内 不 同 种 类 的 产品 或 细节 的 小 计 。 这 个 工具 还 能 提供 可 以 
刻画 为 一 个 立方 体 切片 的 细节 项 ， 或 者 提供 任何 部 分 的 部 分 和 。 

最 有 用 的 OLAP 工 具 提供 帮助 经 理 们 从 任何 角度 观察 数据 的 交互 能 力 。 这 些 工具 通常 从 总 
计 开 始 ， 让 经 理 们 利用 下 钻 得 到 细节 。 例 如 ， 一 个 看 到 年 度 总 和 的 经 理 可 以 下 钻 ， 得 到 每 个 
季度 的 值 ， 然 后 每 月 ， 甚 至 每 一 天 。 与 下 钻 相反 的 是 把 数据 上 卷 到 总 和 或 者 平均 。 与 看 到 每 
个 城市 的 详细 销售 不 同 ， 经 理 们 可 能 希望 看 到 整个 州 的 总 和 。 这 些 术 语 在 图 8-7 中 展示 。 
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客户 所 
在 地 





和 


销售 日 期 


图 8-6 有 关 销 售 的 多 维 立 方 体 。 经 理 们 对 于 不 同 维 的 组 合 很 有 兴趣 ， 比 如 ， 狗 
在 上 个 季度 的 销售 情况 。OLAP 工 具 能 快速 对 涉及 这 个 立方 体 任何 方面 
的 问题 做 出 回答 


销售 日 期 : 时 间 层 次 


ke 


着 
银 别 获得 更 高 级 别 的 总 和 





下 钻 
获得 更 低级 别 的 细节 


图 8-7 ”下 钻 和 上 卷 。 对 给 定 的 维 ， 下 钻 提供 更 多 细节 。 上 卷 聚集 子 类 别 中 的 值 


8.6 OLAP 数 据 库 设 计 


OLAP 数 据 库 设计 与 传统 的 数据 库 设计 不 同 。 一 些 概念 是 相似 的 ， 但 最 终 ， 大 部 分 OLAP 
工具 在 立方 体 结构 中 存储 数据 ， 而 不 是 在 关系 表 中 。 另 外 ，OLAP 设 计 对 最 终 用 户 隐藏 了 表 连 
接 。 管 理 者 只 能 看 到 立方 体 。 

如 果 你 理解 基本 的 查询 ， 那 么 设计 OLAP 立 方 体 就 很 简单 。 但 是 , 需要 学 习 一 些 新 的 术语 ， 
并 理解 立方 体 的 基本 思想 。 首 先 ，OLAP 立 方 体 中 展示 的 所 有 数据 称 作 一 个 度量 。 度 量 是 一 些 
属性 的 数值 量度 ， 比 如 销售 值 或 数量 。 它 通常 都 是 从 一 张 表 中 选 出 来 的 详细 信息 (不 带 
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GROUP BY 的 SELECT 语句 ) ， 尽 管 在 一 些 情况 下 ， 可 能 希望 创建 新 的 查询 来 执行 某 些 基本 的 
计算 ， 比 如 计数 。 度 量 来 自 事实 表 。 事 实 表 通 常 是 数据 库 里 的 一 个 详细 的 表 。 完 物 商 店 的 例 
子 使 用 OLAPItem 查 询 当 作 事 实 表 。 它 是 基于 SaleItem 表 的 ， 后 者 包括 了 Quantity (数量 ) 和 每 
一 项 售 出 物品 的 SalePrice ( 售 价 ) 。Amount (总 计 ) 列 是 一 个 由 Quantity * SalePrice 计 算出 来 
的 列 。 通 常 ， 事 实 表 包 含 一 块 或 者 两 块 经 理 们 想 要 检查 的 数据 ， 然 后 还 有 一 些 列 是 外 码 。 

第 二 步 是 选择 构成 立方 体 的 边 的 属性 。 每 个 属性 或 边 称 作 一 个 维 。 维 是 从 其 他 表 里 选 出 来 
的 属性 。 这 些 维 表 必 须 和 事实 表 相 关 。 通 常 ， 它 们 都 是 连接 到 事实 表 的 外 码 上 的 。 理 论 上 讲 ， 
存在 两 种 OLAP 设 计 : (1) 所 有 的 维 表 都 直接 连 在 事实 表 上 一 一 叫做 星 形 设计 ; 或 者 (2) 至 
少 有 一 个 维 表 在 连接 到 事实 表 以 前 通过 了 第 二 张 表 一 一 称 为 雪花 设计 。 图 8-8 展 示 了 一 个 简单 
的 星 形 设计 。 如 果 添 加 了 足够 的 维 表 ， 你 就 会 发 现 叫 “ 星 形 ” 这 个 名 字 的 原因 了 。 事 实 表 居 
中 ， 并 通过 射线 与 各 维 表 相连 。 





星 形 设计 


维 表 





图 8-8 星 形 OLAP 设 计 。 事 实 表 保 存 经 理 们 希望 检查 的 数值 型 数据 。 维 表 保 存 
特性 。 在 星 形 设计 中 ， 所 有 的 维 表 都 直接 连接 到 事实 表 上 


雪花 设计 有 一 个 更 宽松 的 定义 是 ， 在 连接 到 事实 表 以 前 可 以 通过 其 他 一 些 表 连 接 。 图 8-9 
展示 了 来 自 宠物 商店 数据 库 的 一 个 例子 。 如 果 给 图 中 放 很 多 表 ， 就 会 发 现 这 个 名 字 的 原因 。 
事实 表 居 中 ， 这 和 星 形 设计 一 样 ， 但 维 表 可 以 通过 若干 级 别 向 外 扩展 。 在 星 形 设计 中 ， 所 有 
的 维 表 都 直接 连接 到 事实 表 上 ， 没 有 中 间 媒 介 。 

图 8-6 展 示 的 立方 体 就 是 由 这 里 展示 的 雪花 设计 创建 的 。PetSaleDate (宠物 销售 日 期 )、 
Location (地 点 ) 和 Category (种 类 ) 就 是 用 到 的 三 个 主 维 。 数 量 和 总 计 就 是 从 事实 表 中 拿 出 
的 量度 ， 用 于 产生 每 个 维 的 部 分 和 。PetSaleDate 事 实 上 是 在 图 8-7 中 显示 日 期 的 层次 结构 ， 这 
样 经 理 们 就 可 以 在 不 同 的 级 别 上 检查 数据 。 同 样 ， 地 点 也 可 以 定义 成 一 个 包括 国家 、 州 和 城 
市 的 层次 结构 。 

事实 表 是 基于 二 个 计算 总 计 值 的 查询 。 如 果 使 用 原始 的 SaleItem 表 创建 立方 体 ， 那 会 怎 
样 ?然后 你 可 以 把 Quantity 和 SalePrice 作 为 度量 。 创 建 一 个 计算 的 度量 很 是 诱 人 : Amount2 = 
Quantity * SalePrice。 但 是 ， 这 种 方法 可 能 导致 不 正确 的 结果 。 理 解 这 两 种 方法 的 不 同 是 非常 
关键 的 。 正 确 的 做 法 是 为 每 一 个 需要 逐 行 计算 创建 查询 (Price * Quantity 就 是 一 个 常见 的 例子 ) 。 
如 果 用 OLAP 设 计 立 方 体 来 计算 度量 ， 那 么 这 个 立方 体 就 会 (1) 把 数据 切片 ，(2) 对 每 个 度 
量 (Price 和 Quantity) 分 开 做 部 分 和 ， 然 后 (3) 执行 计算 : Sum (Price) * Sum (Quantity) 。 
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所 以 这 样 的 计算 会 在 已 经 被 加 起 来 的 数据 上 进行 。 图 8-10 用 一 个 很 小 的 例子 展示 了 这 种 差异 。 
当 使 用 对 事实 表 的 查询 计算 乘积 时 ， 各 列 先 乘 再 加 ， 给 出 了 正确 的 总 和 23 美 元 。 如 果 使 用 原 
始 的 表 作 为 事实 表 并 把 立方 体 计算 后 的 度量 作为 计算 结果 ， 立 方 体 就 会 首先 把 数量 和 价格 列 
加 起 来 ， 然 后 执行 乘法 ， 给 出 错误 的 答案 45 美 元 。 解 决 方案 就 是 在 查询 里 逐 行 计算 ， 并 且 使 
用 那个 查询 作为 事实 表 。 





图 8-10 计算 顺序 。 在 用 于 事实 表 的 查询 中 ， 乘 积 运算 是 先 做 的 ， 得 到 正确 的 
总 和 23 美 元 。 在 立方 体 的 计算 结果 下 计算 ， 会 导致 先 算 总 和 ， 然 后 相 
乘 ， 得 到 45 美 元 这 个 不 正确 的 值 


雪花 设计 中 你 首先 注意 到 的 一 件 事 就 是 , 所 做 的 表 连 接 和 执行 一 个 传统 查询 一 样 多 。 一 看 ， 
这 种 设计 比 起 基于 传统 查询 的 系统 并 没有 什么 优势 。 并 且 ， 一 些 应 用 中 ,， 这 种 系统 还 可 能 使 
用 原始 的 数据 表 进 行 分 析 。 但 是 ，OLAP 系 统 通常 都 会 添加 一 些 项 来 提高 性 能 ， 而 且 事实 上 数 
据 并 不 存在 独立 的 表 中 。 例 如 ， 数 据 可 能 复制 多 份 ， 比 如 每 个 订单 都 有 重复 的 顾客 信息 。 或 
者 会 建立 一 些 内 部 指针 来 提供 从 事实 表 到 维 数据 的 快速 连接 。 要 知道 那个 立方 体 是 设计 来 提 
取 数据 的 ， 并 不 改变 ， 所 以 就 避免 了 使 用 INSERT 和 DELETE 带 来 的 数据 不 规范 化 问题 。 在 一 
些 系统 中 ， 你 可 以 创建 查询 的 快照 来 达到 同样 的 效果 。 


8.6.1 OLAP 数 据 分 析 


一 旦 立方 体 创建 并 处 理 ， 数 据 就 可 以 拿 来 分 析 ， 并 被 最 终 用 户 浏览 。 如 图 8-11 所 示 ， 大 多 
数 系统 提供 一 些 类 型 的 立方 体 浏览 器 。 浏 览 器 可 以 让 经 理 们 简单 快速 地 得 到 任何 维 的 部 分 和 ， 
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或 者 执行 过 滤 ， 只 看 某 一 维 的 部 分 元 素 。 事 实 上 ， 在 设计 立方 体 时 就 应 该 考虑 到 这 个 屏幕 。 





图 8-11 OLAP 立 方 体 浏 览 器 。 在 数据 表 中 展示 地 点 维 ; 可 以 展开 ， 或 者 点 击 方 
格 查看 部 分 和 。 其 他 两 维 (Category 和 SaleDate) 在 框 顶部 的 下 拉 框 中 
被 选中 。 这 里 ， 时 间 维 是 展开 的 ， 图 中 显示 的 是 选中 第 二 季度 。 当 数 
值 改变 时 ， 新 的 总 和 将 立即 显示 出 来 


经 理 可 以 通过 双击 相应 的 级 别 对 数据 格 点 所 表示 的 行进 行 下 钼 。 也 可 以 选择 特定 的 地 点 比 
较 部 分 和 。 类 似 地 ， 在 下 拉 框 中 选择 新 值 就 提供 了 立方 体 中 数据 的 一 个 不 同 的 切片 。 即 使 是 

较 大 的 数据 集 ， 结 果 也 会 立即 显示 。 
” “在 桌面 上 ， 微 软 提供 了 一 个 可 以 运行 到 Excel 内 部 ， 其 至 交互 式 Web 页 面 里 的 强大 的 立方 
体 浏览 器 。 轴 表 就 是 多 维 立方 体 的 一 个 交互 式 界面 。 轴 表 在 用 户 的 机 器 上 创建 ， 大 多 数 人 都 
会 在 微软 的 Excel 内 部 创建 轴 表 。 这 个 工具 有 很 多 选项 ， 为 用 户 提供 了 许多 灵活 的 用 途 。 它 可 
以 连接 到 OLAP 立 方 体 和 在 各 种 系统 中 创建 的 数据 库 上 。 

图 8-12 展 示 了 针对 宠物 商店 例子 的 轴 表 报表 。 通 过 在 一 行 或 一 列 维 上 点 击 ， 经 理 们 可 以 看 
到 细节 或 部 分 和 。 他 们 也 可 以 选择 包含 在 部 分 和 中 特定 的 项 。 经 理 们 甚至 可 以 灵活 地 拖 动 这 
些 维 ， 把 它们 从 列 移 到 行 ， 或 者 改变 聚集 的 顺序 。 附 加 的 一 些 选项 提供 了 其 他 统计 功能 ， 比 
如 平均 值 。 强 大 的 图 形 选 项 可 以 轻易 支持 通过 Excel 接 口 创建 图 表 ， 这 对 大 多 数 商 务 经 理 都 很 
熟悉 。 
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| Bird cat Da Fsh WM 
WUSA | 5 24653. 
Grand Total* 1 " 





图 8-12 微软 的 轴 表 报表 。 轴 工具 让 经 理 们 可 以 轻易 地 从 任何 角度 检查 立方 体 
数据 ， 选 择 数据 的 子 集 ， 执 行 计算 以 及 生成 图 表 

轴 表 工具 非常 强大 ， 并 且 事实 上 离开 了 OLAP 或 者 数据 仓库 也 能 使 用 。 但 是 ， 和 OLAP 服 
务 器 结合 起 来 ， 轴 表 可 以 运行 得 非常 快 。 要 在 Excel 中 使 用 OLAP 选 项 创建 轴 表 ， 只 需 简单 地 
选择 菜单 里 的 Data， 然 后 再 选 PivotTable Report 选 项 即 可 。 一 旦 激活 ， 下 一 步 就 是 获得 外 部 数 
据 。 选 择 OLAP 立 方 体 标签 ， 再 选择 一 个 新 的 数据 源 。 从 这 儿 开 始 ， 选 项 就 和 传统 的 轴 表 一 样 
了 。 把 各 个 维 拖 到 行 或 列 的 标题 中 ， 然 后 把 事实 表 (总 计 ) 拖 到 表格 中 央 。 从 这 点 开始 ， 有 
很 多 选项 可 以 用 来 自 定义 布局 或 是 创建 图 表 。 选 择 OLAP 立 方 体 标签 来 从 立方 体 中 提取 数据 ， 
而 不 是 直接 从 数据 库 中 提取 ， 这 一 点 很 重要 。 把 数据 从 数据 库 中 抽出 来 意味 着 轴 表 已 经 完成 
所 有 数据 提取 和 执行 计算 的 任务 了 。 做 完了 OLAP 立 方 体 就 意味 着 立方 体 服务 器 已 经 完成 了 绝 
大 部 分 工作 ， 并 且 ， 客 户 端的 轴 表 只 是 负责 显示 和 操作 数据 。 


8.6.2 SQL 中 的 OLAP 


如 果 考 虑 OLAP 立 方 体 的 概念 以 及 如 何 使 用 它 ， 就 会 认识 到 那 是 检查 多 个 GROUP BY 语句 
结果 的 一 种 方法 。 因 此 ，SQL 99 标 准 在 SQL 里 添加 了 一 些 计 算 基本 的 OLAP 结 果 的 特征 。 注 意 
这 些 扩展 并 不 改变 数据 库 的 结构 ， 你 仍 需 解决 和 索引 相关 的 冲突 。 

在 宠物 商店 例子 中 ， 如 果 在 两 列 里 使 用 GROUP BY 语句 会 怎样 ? 图 8-13 展 示 了 宠物 商店 例 
子 里 在 两 列 (动物 类 别 和 销售 月 份 ) 包含 了 GROUP BY 计算 的 查询 的 部 分 结果 。 它 提供 了 每 
个 类 别 元 素 每 个 月 的 部 分 和 。 假 定 所 有 的 动物 类 型 在 所 有 的 月 份 都 有 出 售 ， 你 将 看 到 12 个 针 
对 鸟 的 值 ，12 个 对 猫 的 ，12 个 对 狗 的 ， 等 等 。 你 没 得 到 超 聚 集 的 总 和 ， 或 者 整个 类 别 或 跨越 
所 有 行 的 总 和 。 例 如 ， 鸟 这 个 商品 全 年 的 销售 总 值 是 多 少 ? 


SELECT Category Month(SaleDate) AS Monith, 
Sum(Quantity * SalePrice) AS Amount 
FROM Sale INNER JOIN (Merchandise 
INNER JOIN Saleltem 
ON Merchandise.litemlD = Saleltem. ltemiD) 
ON Sale.SalelD = Saleltem.SalelD 
GROUP BY Category, Month (SaleDate); 





图 8-13 含有 两 个 GROUP BY 列 的 SELECT 查 询 。 可 以 得 到 每 个 动物 类 别 每 个 
月 的 部 分 和 ， 却 看 不 到 跨越 整个 类 别 ( 全 年 鸟 的 销售 ) 的 合计 ， 也 得 
不 到 全 体 的 总 和 
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ROLLUP 

可 以 通过 使 用 额外 的 SELECT 语句 得 到 这 些 超 聚 集 的 总 和 。 但 是 ，SQL 99 添 加 了 专门 计算 
超 聚 集 总 和 的 ROLLUP 选 项 。 图 8-14 展 示 了 对 宠物 商店 查询 的 结果 。 对 每 个 Category 列 里 面 的 
元 素 都 计算 了 跨越 所 有 月 份 的 总 和 。 这 个 总 和 显示 出 来 时 ， 月 份 是 空 值 。 在 底部 ， 显 示 着 带 
有 两 个 空 值 的 全 部 总 和 。 当 然 ， 超 聚集 总 和 通常 并 不 用 黑体 表示 ， 所 以 可 能 很 难 发 现 。 一 个 
更 大 的 问题 是 ， 如 果 一 些 月 份 有 缺失 值 〈 空 值 ) 会 怎样 ? 在 鸟 销售 有 日 期 缺失 的 情况 下 ， 其 
显示 就 会 包含 两 个 类 似 的 把 鸟 作为 类 别 的 行 ， 一 个 针对 月 份 的 空 值 (缺失 值 ) 以 及 某 个 总 计 。 
一 个 值 将 是 鸟 这 个 产品 在 那个 缺失 的 月 份 的 销售 总 和 。 第 二 个 将 是 所 有 日 期 的 超 聚 集 总 和 。 
但 怎么 知道 哪个 是 哪个 呢 ? 如 果 细 细 观 察 这 些 总 和 数据 ， 你 就 可 能 意识 到 较 大 的 总 和 应 该 是 
超 聚 集 总 和 的 值 。 但 对 于 其 他 函数 ， 比 如 均值 ， 就 没有 任何 方法 可 以 辨认 了 。 


SELECT Category, Month ..., Sum ... 
FROM ... 
GROUP BY ROLLUP (Category， Month ... 


Category Month Amount 


Bird 1 135.00 
Bird 2 45.00 


Bird (null) 607.50 
Cat 1 396.00 
Cat 2 113.85 


Cat (null) 1,293.30 


ui (null) 8,451.79 





图 8-14 ROLLUP 选 项 。 给 GROUP BY 语句 添加 ROLLUP 选 项 将 产生 超 聚 集 总 
和 。 在 这 个 例子 里 ， 该 查询 提供 了 每 个 类 别 元 素 的 总 和 以 及 全 部 合 起 
来 的 总 和 。 注 意 ， 对 应 的 月 份 是 空 值 
为 了 标识 超 吝 集 的 行 ，SQL 标 准 引 入 了 GROUPING 函 数 。 如 图 8-15 所 示 ， 这 个 函数 通常 返 
回 一 个 0 值 。 当 显示 的 行 是 超 聚 集 的 计算 结果 时 ， 显 示 的 值 为 1。 在 这 个 例子 中 ， 对 于 每 个 类 
别 的 产品 ， 跨 越 月 份 的 总 和 对 GROUPING (Category) 函数 都 会 产生 1 这 个 值 。 全 部 的 总 和 在 
两 个 指示 列 里 都 显示 1 值 。 这 个 函数 也 可 以 用 来 进行 其 他 计算 ， 甚 至 在 WHERE 条 件 中 。 例 如 ， 
你 可 能 希望 针对 超 豪 集 总 和 再 进行 计算 。 < 
CUBE 
看 看 结果 ， 很 显然 ROLLUP 选 项 并 不 提供 经 理想 要 着 到 的 一 切 信息 。 例 子 中 ， 超 聚集 总 和 
只 应 用 到 Category 列 上 。 没 有 相应 的 针对 Month 列 的 总 和 ， 或 者 说 没有 针对 一 个 给 定 月 份 的 所 
有 销售 的 总 和 。 当 然 ， 如 果 你 重 写 查询 并 且 在 GROUP BY 子 句 中 其 个 Category 和 Month 列 的 顺 
序 ， 你 也 能 获得 这 些 总 和 。 
CUBE 选 项 提供 了 解决 方案 。CUBE 选 项 和 ROLLUP 类 似 ， 但 是 对 所 有 的 GROUP BY 列 都 计 
算 并 显示 超 聚 集 。 在 图 8-16 中 ,注意 SQL 语句 的 惟一 更 改 就 是 把 ROLLUP 关 键 字 换 成 了 CUBE。 
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结果 仍然 包含 针对 每 个 类 别 跨越 月 份 的 超 聚 集 总 和 。 这 些 总 和 在 Ge 指示 列 有 一 个 1 值 。 但 是 查 
询 同时 产生 了 对 每 个 月 跨越 所 有 产品 类 别 的 超 聚 集 总 和 。 针 对 三 个 月 的 这 些 值 就 显示 在 结果 的 
底部 附近 。 注 意 Category 下 的 空 值 ，Gm 列 值 为 1 表示 了 那 是 这 个 月 的 超 聚 集 总 和 。 


SELECT Category， Month ..., Sum ...， 
GROUPING (Category) AS Gc, 
GROUPING (Month) AS Gm 

FROM ... 

GROUP BY ROLLUP (Category, Month ... 


Category Month Amount Gc Gm 
一 一 一 一 -一 一 


Bird 1 135.00 0 
Bird 45.00 0 


Bird 32.00 
Bird 607.50 


Cat 396.00 
Cat 113.85 


Cat (null) 1,293.30 


(null) (null) 8,451.79 





图 8-15 GROUPING 函 数 。 对 选择 的 列 参 数 ， 当 显示 超 聚 集 行 时 ，GROUPING 
函数 就 返回 1 









SELECT Category, Month, Sum, GROUPING (Category) 
AS Gc, GROUPING (Month) AS Gm 

FROM ... 

GROUP BY CUBE (Category， Month ...) 













Category Month Amount Gc Gm 







Bird 1 135.00 0 0 
Bird 2 45.00 0 0 
Bird (null) 32.00 0 0 
Bird (null) 607.50 1 0 
Cat 1 396.00 0 0 

113.85 0 0 












Cat (null) 1,293.30 
(null) 1 1,358.8 







OOO~ 





(nulh 2 1,508.94 
(null) 3 2,362.68 
(null) (nui) 8,451.79 1 








图 8-16 CUBE 选 项 。CUBE 选 项 对 GROUP BY 语句 中 的 所 有 列 都 计算 超 聚 集 总 
和 。 在 底部 附近 的 Gm 指示 列 值 为 1 的 行 就 是 各 月 对 所 有 类 别 产品 的 总 和 
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由 于 这 些 额 外 的 总 和 ， 你 很 可 能 使 用 CUBE 比 ROLLUP 多 。 但 是 ， 如 果 你 给 GROUP BY 语 
名 再 加 一 些 列 ， 你 就 会 得 到 很 多 的 部 分 和 ， 以 致 于 你 可 能 希望 使 用 ROLLUP 来 简化 显示 。 
SQL 标准 提供 了 额外 的 选项 ， 包 括 在 联合 


多 个 列 的 值 时 创建 基于 CUBE 或 ROLLUP 的 查 SY 90 
询 。 你 也 可 以 使 用 GROUPING SETS 隐 藏 详细 GROUP BY GROUPING SETS 
的 部 分 和 ， 只 显示 超 聚 集 总 和 。 如 图 8-17 所 示 ， ( ROLLUP (Category), 


ROLLUP (Month), 
SQL 很 容易 懂 。GROUPING SETS 让 你 可 以 对 () on 


每 一 列 指定 你 希望 看 到 的 超 聚 集 。 这 个 例子 里 ， ) 


请 求 3 个 独立 的 计算 : ( 1 ) 跨越 月 份 的 类 别 总 和 9 Category Month | Amount 


(2) 跨越 类 别 的 月 份 总 和 , 以 及 (3) 圆 括号 里 | Bd Gu 60750 

指定 的 重要 总 和 。 查 询 的 结果 是 没有 显示 细节 Cat (null) 1,293.30 
的 部 分 和 ， 而 只 显示 了 请 求 的 超 聚 集 总 和 。 本 和 

(null) 1 1,358.8 

尽管 ROLLUP 和 CUBE 选 项 给 SQL 带 来 了 新 (null) 2 1,508.94 

的 特性 ， 但 其 结果 很 难 阅 读 。 在 OLAP 值 这 方 (null) 3 2,362.68 


面 ， 你 可 能 不 愿意 把 这 种 结果 拿 给 经 理 们 ， 或 
者 希望 他 们 能 够 交互 地 使 用 这 些 工 具 。 另 一 方 
面 ， 当 需要 进行 更 高 级 的 计算 而 把 数据 转 和 到 “图 8-17 GROUPING SETS 选 项 。 陷 藏 详细 的 部 


(null) (null) 8,451.79 





你 写 的 过 程 中 ， 或 把 数据 转换 到 电子 表格 中 时 ， 分 和 而 只 显示 超 聚 集 总 和 是 可 以 的 。 这 
这 些 选 项 (ROLLUP 等 ) 可 能 很 有 用 。 个 例子 请 求 3 个 总 和 ; 按 Category， 按 
Month 以 及 空 括号 里 面 的 全 部 


8.6.3 SQL 分 析 函 数 


SQL-99 为 常见 的 OLAP 分 析 添 加 了 一 些 有 用 的 数学 函数 。 例 如 ， 标 准 差 的 统计 函数 
(STDDEV_POP 和 STDDEV_SAMP)., 方差 (VAR_POP 和 VAR_SAMP)、 协 方差 
(COVAR_POP 和 COVAR_SAMP)、 相 关系 数 (CORR) 以 及 线性 回归 (REGR_SLOPE 等 ) 都 
是 标准 的 一 部 分 。 由 于 大 多 数 数据 库 系统 已 经 有 了 这 些 函 数 的 自主 版 本 ， 这 个 冲击 也 就 不 那 
么 明显 了 ,但 它 会 帮助 厂商 采用 这 些 函 数 的 标准 名 字 。 

最 有 意思 的 是 ， 标 准 还 定义 了 若干 种 可 以 自动 生成 序号 的 函数 。 考 虑 一 个 想 要 在 部 门 内 部 
比较 各 雇员 的 销售 情况 的 经 理 (或 者 想 列 出 某 个 体育 锦标 赛 的 结果 )。 图 8-18 显 示 了 基本 的 
SELECT 语句 。 排 序 函 数 是 作用 在 一 个 范围 的 值 上 的 ， 并 且 每 个 范围 都 得 排序 。 同 时 也 要 注意 
RANK 和 DENSE_RANK 函 数 的 区 别 。 两 种 情况 下 ， 相 等 的 值 都 会 得 到 同样 的 序号 。 差 异 就 在 
于 ， 在 相等 值 后 面 从 名 个 值 重 新 开始 。RANK 函 数 跳 过 那些 将 被 分 配 的 值 (例子 中 的 第 三 个 序 
号 )。DENSE_RANK 函 数 并 不 跳 过 那些 值 并 在 下 一 次 有 效 的 序号 分 配 中 再 次 使 用 它 。 标 准 还 
提供 PERCENT_RANK 和 CUME_DIST 函 数 来 计算 每 个 值 的 百分比 和 累计 百分比 的 序号 。 同 样 
有 一 个 ROW_NUMBER 函 数 对 查询 中 每 一 个 显示 的 行 返 回 标记 了 数字 行 。 


8.6.4 SQL 的 OLAP 窗 口 


SQL-99 标 准 为 OLAP 定 义 了 一 些 有 用 的 扩展 ， 使 得 SQL 中 某 些 类 型 的 查询 更 加 简单 了 。 尽 
管 大 部 分 数据 库 还 没有 实现 这 个 标准 ， 但 公司 们 以 后 会 慢 人 慢 添 加 这 些 特 性 的 。 有 两 个 元 素 很 





有 用 : (1) 窗口 划分 和 (2) 针对 以 前 行 的 计算 。 


SELECT Employee, SalesValue 
RANK() OVER (ORDER BY SalesValue DESC) AS rank 

DENSE_RANK( ) OVER (ORDER BY SalesValue DESC) AS dense 
FROM Sales 
ORDER BY SalesValue DESC, Employee; 
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Employee SalesValue Rank Dense 


Jones 18,000 1 
Smith 16,000 2 
Black 16,000 2 
White 14,000 4 





图 8-18 RANK 函 数 。 序 号 函数 的 排列 顺序 是 分 别 确定 的 。 相 等 值 获得 相同 的 
序号 。RANK 跳 过 那些 原先 将 分 配给 相等 值 的 序号 。DENSE_RANK 不 


跳 过 


计算 总 和 时 ， 划 分 和 分 组 是 相似 的 ， 都 是 指定 一 列 ， 再 把 数据 划分 或 分 组 。 其 不 同 在 于 使 
用 GROUP BY 时 ， 你 只 得 到 每 个 组 的 聚集 结果 。 而 使 用 PARTITION 时 ， 你 得 到 的 是 按 选 取 的 


列 组 织 的 单独 的 行 。 图 8-19 展 示 这 种 差异 。 


SELECT Category, SaleMonth, MonthAmount, 
AVG (MonthAmount) 
OVER (PRRTITION BY Category 
ORDER BY SaleMonth ASC ROWS 2 PRECEDING) 
AS MA 
FROM qryOLAPSQL99 
ORDER BY SaleMonth ASC; 


Category SaleMonth MonthAmount 


1,600.00 
1,850.00 





SELECT Category, SaleMonth, 
AVG (MonthAmount) AS Average 

FROM qryOLAPSQL99 

ORDER BY SaleMonth ASC; 


Category SaleMonth Average 


200101 1,925.00 
200101 5,500.00 


图 8-19 SQL-99 OLAP PARTITION 与 GROUP BY 的 对 比 。 窗 口 的 PARTITION 
语句 可 以 和 细节 行 一 起 显示 聚集 数据 (均值 )。GROUP BY 语句 只 提供 
聚集 数据 。 同 时 ，PRECEDING 语 句 在 划分 中 计算 跨越 以 前 行 的 数据 
用 PARTITION 语 句 同样 可 以 跨越 选取 的 一 些 以 前 的 行 来 计算 聚集 。 这 个 例子 需要 当前 行 
前 面 两 行 数 据 的 动态 均值 。 尽 管 DBMS 可 以 自由 使 用 任何 方法 来 执行 计算 ， 我 们 想 想 如 下 步骤 
的 划分 过 程 。 首 先 ， 提 取出 数据 并 且 按 Category 和 SaleMonth 排 序 。 其 次 ， 在 每 个 类 别 内 部 ， 


系统 检查 每 一 行 并 计算 前 面 两 行 数据 的 均值 。 


厂商 们 实现 SQL-99 的 所 有 这 些 新 特性 还 需要 时 间 。 同 时 ， 你 应 该 知道 Oracle 已 经 在 别 的 环 
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境 下 使 用 PARTITION 关 键 字 多 年 了 ， 所 以 要 小 心 使 用 这 个 语法 。 在 Oracle 中 ， 划 分 表示 相应 数 
据 表 的 不 同 物理 组 织 。 

OVER 语 句 支 持 指 定 行 的 变化 范围 。 它 用 来 执行 和 当前 行 相关 的 一 些 计 算 ， 所 以 可 以 向 前 
或 向 后 计算 差 值 或 均值 。 图 8-20 展 示 了 一 些 RANGE 函 数 的 常用 选项 。 整 个 查询 计算 3 个 总 和 值 。 
第 1 个 SUM 命 令 计算 查询 从 开始 到 当前 行 的 总 和 值 。 第 2 个 SUM 函 数 做 同样 的 事 ， 但 显 式 地 表 
明了 开始 和 结束 行 。 第 3 个 SUM 函 数 从 查询 的 当前 行 到 最 后 一 行 计算 总 和 值 。 在 第 2 和 第 3 个 例 
子 里 ， 注 意 UNBOUNDED 关 键 字 指 定 开始 或 结束 行 的 作用 。 如 果 只 是 希望 计算 前 面 或 后 面 一 
些 特定 编号 的 行 的 总 和 ， 可 以 指定 编号 值 来 代替 它们 。 


SELECT SaleDate, Value 
SUM(Value) OVER (ORDER BY SaleDate) AS running_sum, 
SUM(Value) OVER (ORDER BY SaleDate RANGE 

BETWEEN UNBOUNDED PRECEDING 


AND CURRENT ROW) AS ruming sum2, 


SUM (Value) OVER (ORDER BY SaleDate RANGE 
BETWEEN CURRENT ROW 
AND UNBOUNDED FOLLOWING) AS remaining_sum; 
FROM ... 





图 8-20 OVER 和 RANGE 函数 。 第 1 个 SUM 函 数 计算 从 开始 到 当前 行 的 总 和 。 
第 2 个 SUM 函 数 更 清楚 地 做 同样 的 事 。 第 3 个 SUM 函 数 累 加 了 从 当前 行 
一 直到 查询 结束 行 的 值 

绝 大 部 分 数据 库 系统 也 提供 LAG 和 LEAD 函数 的 使 用 。 这 些 函 数 设 计 成 内 联 函 数 ， 用 来 引用 
前 面 或 后 面 一 些 特定 编号 的 行 。 例 如 ，LAG 函 数 让 引用 上 一 行 的 值 变 得 简单 。 图 8-21 展 示 了 其 
基本 语法 以 及 一 个 单 周 期 LAG 和 单 周 期 LEAD 的 结果 。 这 些 函 数 的 强大 之 处 在 于 其 他 一 些 计算 中 
也 可 以 轻易 使 用 LAG 或 LEAD 变 量 。 这 些 函 数 并 不 是 官方 SQL 标准 的 一 部 分 ， 所 以 不 同 的 厂商 之 
间 会 有 一 些 差异 。 比 如 ， 你 或 许 并 不 能 分 配 一 个 默认 值 ， 而 这 在 最 前 (或 最 后 ) 一 些 没有 定义 
值 的 行 中 比较 有 用 。 由 于 大 多 数 系统 都 支持 这 些 函 数 ， 也 因为 它们 确实 有 用 ， 所 以 也 值得 学 习 。 



















LAG or LEAD: (Column, # rows, default) 








SELECT SaieDate, Value， 
LAG (Value 1,0) OVER (ORDER BY SaleDate) AS prior_day 
LEAD (Value 1,0) OVER (ORDER BY SaleDate) AS next_day 

FROM ... 

ORDER BY SaleDate 





SajeDate Value prior_day next_day 
1/1/2003 1,000 0 1,500 
1/2/2003 1,500 1,000 2,000 
1/3/2003 2,000 1,500 2,300 





1/31/2003 3,500 3,200 0 


图 8-21 LAG 和 LEAD 函 数 。 作 为 内 联 函 数 ， 它 们 可 以 很 轻易 从 前 一 或 后 一 行 
| 中 返回 值 。 你 可 以 指定 向 前 或 向 后 走 多 少 行 
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8.7 数据 挖掘 


数据 挖掘 的 目标 就 是 发 现 能 用 来 得 到 更 好 决策 的 未 知 关系 。 图 8-22 展 示 和 其 他 数据 提取 技 
术 相 比 ， 数 据 挖掘 是 一 个 自 底 向 上 的 方法 。 高 度 专业 化 的 工具 用 来 检查 数据 库 ， 以 寻找 关系 
和 其 他 有 用 的 细小 信息 。 这 类 工具 相对 比较 自动 化 ， 可 以 只 需 极 少 指导 就 能 发 现 模式 。 其 他 
的 需要 通过 模型 构造 器 多 进行 一 些 输入 和 设 定 。 这 些 技术 中 的 大 部 分 都 是 探测 性 的 ， 因 为 你 
不 是 在 验证 一 个 预期 值 ， 而 是 在 查找 一 些 未 知 的 关系 。 一 些 例 程 从 统计 分 析 而 来 ， 其 他 都 很 
具体 ， 从 特定 的 任务 而 来 。 这 一 节 提 出 更 为 流行 的 一 些 技术 概要 。 详 细 的 统计 和 编程 问题 不 
在 这 儿 涉及 ， 可 以 在 专业 教科 书 中 找到 。 


事务 和 操作 


随时 出 现 的 特定 问题 


聚集 ， 比 较 ， 下 钻 





未 知 的 关系 


图 8-22 数据 挖掘 。 其 目标 是 识别 未 知 关 系 。 数 据 挖 掘 是 一 种 自 底 向 上 的 模式 
发 现 方法 。 由 高 度 专业 化 的 工具 扫描 数据 ， 寻 找 可 能 有 用 的 信息 


图 8-23 列 出 了 一 些 常见 的 数据 挖掘 技术 。 有 时 


。 分 类 /预测 /回归 
候 ，DBMS 厂 商会 在 基本 的 系统 中 包含 一 些 这 类 技 。 关联 规则 /购物 篮 分 析 
术 。 但 是 ， 大 多 数 厂 商都 会 把 数据 挖 气 技 术 作为 附 * 到 类 
加 产品 进行 销售 。 还 有 从 专门 的 数据 控 气 公司 而 来 Ee 
的 很 多 其 他 技术 。 不 管 哪 种 情况 ， 通 常 都 需要 建 模 . 神经 网 络 
器 工具 ， 帮 助 构建 合适 的 模型 ， 并 解释 结果 。 数 据 偏差 俩 测 
分 类 和 购物 篮 分析 是 商业 活动 中 两 种 常见 的 数据 分 a 
析 方 法 ， 因 为 它们 对 许多 类 型 的 问题 都 很 有 用 。 地 网 站 分 析 
理 系统 对 一 些 特定 问题 也 是 强大 的 解决 方案 。 通 过 "空间 /地 理 分 析 


。 文 本 分 析 





日 志 进 行 时 间 序 列 评估 的 网 站 分 析 也 变 得 流行 起 
来 。 可 以 评估 超大 型 数据 集 的 新 技术 和 方法 也 在 不 ”图 8-23 数据 挖掘 技术 。 分 类 和 购物 篮 分 析 


断 开 发 中 。 是 商业 活动 中 的 流行 技术 。 评 估 关 
系 的 新 技术 和 方法 仍 在 不 断 开 发 中 
8:7:| :分 业 


如 图 8-24 所 示 ， 许 多 商业 问题 都 得 益 于 分 类 分 析 。 已 经 有 很 多 工具 开发 出 来 用 于 评估 可 
以 预测 结果 的 关系 。 像 回归 这 样 的 统计 方法 已 经 可 以 直接 使 用 了 。 尽 管 如 此 ， 统 计 方法 有 两 
个 缺点 ， 就 是 它们 趋向 于 假设 存在 线性 关系 ， 并 且 这 种 评估 是 基于 均值 的 ， 但 最 重要 的 隐 含 
关系 常常 很 细小 ， 以 至 于 很 难 由 均值 表示 。 例 如 ， 你 可 能 在 查找 那些 可 能 因 鼓 励 而 回头 、 并 
购买 更 多 东西 的 新 顾客 。 由 于 是 新 顾客 ， 你 多 半 并 没有 足够 的 数据 去 创建 一 个 统计 性 的 重要 
效果 。 
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“哪些 借款 人 /贷款 最 可 能 成 功 ? 
“哪些 客户 最 可 能 想 要 一 个 新 的 商品 ? 
“哪些 公司 最 可 能 提出 破产 ? 


* 哪些 工人 最 可 能 在 下 面 6 个 月 内 辞职 ? 
* 哪些 正在 起 步 的 公司 最 可 能 成 功 ? 
* 哪些 纳税 申报 单 是 假 的 ? 





图 8-24 分 类 的 例子 。 许 多 常见 的 商业 问题 都 能 得 益 于 分 类 分 析 。 每 个 问题 都 
有 一 个 结果 ， 且 其 目标 就 是 基于 一 系列 属性 把 元 素 分 进 结果 中 


可 以 用 分 类 分 析 评 估 的 问题 都 有 一 个 受 指示 属性 集 影响 的 结果 。 基 本 目标 就 是 估计 每 个 指 
示 变 量 效果 的 好 处 和 它 对 结果 的 影响 。 例 如 ， 银 行 可 能 在 诸如 工作 稳定 性 、 信 用 历史 和 收入 
这 些 贷款 人 属性 上 有 历史 数据 。 以 最 终结 果 (是 否 付出 贷款 ) 为 目的 ， 数 据 挖掘 系统 可 以 评 
估 这 些 变量 的 每 一 项 对 结果 的 影响 。 这 些 权重 可 以 用 于 以 后 的 顾客 数据 ， 来 帮助 确定 是 否 同 
意 贷款 ， 或 者 影响 收取 的 利率 。 

图 8-25 表 示 一 个 借贷 情况 下 的 小 例子 。 数 据 可 能 是 类 别 的 〈 是 / 否 ) 或 连续 的 (比如 收入 )。 
一 些 分 类 工具 在 两 种 类 型 的 数据 下 都 能 工作 ， 一 些 需 要 转化 成 类 别 数据 。 例 如 ， 收 入 数据 可 
以 被 转化 为 二 元 的 ， 比 如 低 : 0~30 000， 中 : 30 000~70 000; 高 : 70 000~120 000， 以 及 富有 : 
120 000 以 上 。 当 然 ， 你 还 面临 着 新 的 怎样 画 线 来 区 分 这 些 绝对 数值 的 数据 挖掘 问题 。 一 些 工 
有 具 同时 提供 了 帮助 做 此 决定 的 系统 。 





图 8-25 银行 移 款 分 类 。 指 示 器 属性 以 某 种 形式 影响 结果 。 数 据 挖 据 软 件 在 一 
不 测试 数据 集 上 评估 每 种 属性 的 分 量 。 生 成 的 结果 模型 可 以 用 于 对 未 
来 的 数据 ， 预 测 新 贷款 潜在 的 成 功 或 失败 概率 
常见 的 分 类 工具 包括 各 种 回归 方法 ， 贝 叶 斯 分 析 、 决 策 树 (特别 对 于 层次 性 数据 ) 、 遗 传 
算法 以 及 神经 网 络 。 其 中 ， 神 经 网 络 在 典型 情况 下 需要 最 少 的 指导 ， 而 高 级 回归 技术 则 依赖 
于 有 经 验 的 建 模 师 的 技巧 。 任 何 分 类 分 析 的 关键 要 素 就 是 对 现 有 和 新 的 实例 ， 模 型 需要 预测 
得 多 准确 。 


8.7.2 关联 规则 /购物 篮 分 析 


购物 篮 分 析 为 促使 数据 挖掘 被 人 们 接受 立 下 了 不 可 磨灭 的 功劳 。 最 初 ， 这 种 技术 用 于 分 析 
顾客 在 便利 店 的 购物 情况 ， 因 此 得 到 购物 篮 这 个 术语 。 更 通用 的 术语 关联 规则 表示 可 以 用 于 
其 他 情况 的 方法 学 。 这 些 系 统 回 答 的 基本 问题 是 : 顾客 最 容易 同时 购买 哪些 商品 ? 或 者 ， 从 
规则 的 角度 讲 ，A 的 存在 是 否 意 味 着 B 的 存在 ?典型 的 情况 是 ， 便 利 店 发 现 购买 了 尿布 的 顾客 


条 8 章 数据 合 库 和 数据 抢 据 271 





常常 同时 也 购买 啤酒 一 一 特别 是 在 星期 四 和 星期 五 晚上 。 这 个 信息 的 重要 性 在 于 经 理 们 可 以 利 
用 它 来 增加 销售 。 比 如 ， 可 以 考虑 在 商店 里 把 这 两 样 东西 放 得 靠近 一 些 ， 鼓 励 更 多 的 顾客 同 
时 买 走 两 样 。 同 样 ， 制 造 商 也 可 以 使 用 相同 的 知识 通过 提供 优惠 券 或 把 相关 产品 打包 描述 来 
交 又 销售 。 

购物 篮 分 析 需 要 一 系列 的 事务 数据 , 这 些 数据 要 包括 一 个 人 购买 的 所 有 产品 的 列表 。 今天 ， 
这 种 数据 可 以 很 轻易 地 从 使 用 了 条 码 扫 描 器 的 超级 市 场 或 大 型 连锁 店 获得 。 大 多 数 公 司 都 会 
把 这 些 数据 卖 给 一 些 专门 的 公司 ,他 们 再 转卖 给 其 他 公司 。 分 析 软 件 扫描 这 些 数 据 并 比较 每 
一 项 和 其 他 项 的 关系 ， 寻 找 是 否 有 模式 存在 。 在 这 个 过 程 中 ， 软 件 会 计算 出 你 用 来 评估 这 种 
关系 或 规则 的 3 个 值 。 当 用 于 两 个 项 时 ， 其 定义 比较 容易 理解 ， 但 也 适用 于 多 个 项 的 情况 。 规 
则 的 支持 度 是 同时 包含 了 两 个 项 的 事务 的 百分比 度量 。 从 统计 上 讲 , 这 个 概率 由 P(A4mB) 表示 ， 
由 同时 包含 了 两 个 项 的 事务 数目 除 以 事务 总 数 计算 得 来 。 可 以 对 4 和 8 单 独 计算 类 似 的 值 ， 或 
每 个 单独 的 项 被 购买 的 次 数 的 百分比 。 支 持 度 高 一 些 表示 两 样 商 品 频繁 地 被 同时 购买 一 -但 这 
个 数字 并 没有 告诉 我 们 是 其 中 一 个 导致 了 另 一 个 。 而 规则 (4 蕴含 8) 的 置信 度 是 含有 4 项 的 事 
务 也 含有 B 项 的 百分比 度量 。 从 统计 的 角度 讲 ， 它 是 假设 4 已 经 被 选中 , 那么 8 也 被 选中 的 概率 ， 
记 为 P(BI4)。 根 据 统计 定义 ，P(BI4) = P(A4mB)/P(4)， 所 以 计算 起 来 相对 更 容易 。 同 样 ， 置 信 
度 高 一 些 就 指示 了 A 项 的 购买 导致 了 B 项 的 购买 。 大 多 数 数据 挖掘 工具 所 声称 的 第 三 个 统计 值 
是 提升 度 。 与 没有 规则 的 购买 相 比 ， 提 升 度 (Lift) 是 规则 的 一 个 潜在 的 增益 属性 。 如 果 这 个 
值 比 ! 大 ， 增 益 就 是 正 的 。 从 概念 上 讲 ， 它 表示 由 关联 而 引起 的 销售 增加 。 从 统计 的 角度 讲 ， 
它 可 以 由 P(A4mB)/(P(4)*P(B)) 或 P(BIA)/P(B) 计算 得 到 。 

图 8-26 展 示 在 尿布 和 啤酒 例子 里 这 些 数 字 是 怎么 计算 出 来 的 。 数 字 都 是 虚构 的 但 代表 了 这 
种 情况 。 注 意 提升 度 比 1 大 了 很 多 (1.714)， 表 示 这 种 关联 有 力 地 促进 了 啤酒 的 销售 。 数 据 挖 
掘 软件 对 所 有 基本 的 项 目 对 都 计算 所 有 这 些 值 。 如 果 有 很 多 项 ， 这 个 过 程 可 能 运行 很 长 时 间 。 
同时 ， 也 可 以 在 分 析 中 考虑 多 个 项 : 床单 和 枕头 的 购买 是 否 导致 毛巾 的 销售 ? 尽管 如 此 ， 把 
太 多 维 结合 起 来 会 导致 巨 量 的 计算 问题 ， 所 以 大 多 数 分 析 都 在 有 限 的 比较 集 里 进行 。 





图 8-26 评估 购物 篮 关联 。 支 持 度 是 指 一 个 事务 同时 含有 两 项 的 百分比 。 置 信 
度 是 假定 购买 了 尿布 (D) ， 而 又 购买 了 啤酒 (B) 的 概率 。 提 升 度 是 
指 其 结果 对 销售 的 贡献 ， 且 一 般 应 该 大 于 1 


在 购物 篮 分 析 中 , 很 快 就 会 磁 到 一 些 问 题 。 首先 , 购买 量 较 小 的 一 些 项 可 能 造成 误导 的 值 。 
如 果 一 项 只 购买 了 一 两 次 ， 那 么 和 它 一 起 购买 的 所 有 东西 都 可 以 看 作 与 它 有 关 。 因 此 ， 你 必 
须 检 查 数据 ， 并 改变 分 组 以 保证 大 部 分 项 购买 的 频 度 差不多 。 图 8-27 展 示 了 一 个 假设 的 情况 ， 
一 个 销售 大 量 木材 的 五 金 店 却 只 销售 很 少量 的 钉子 和 螺丝 。 为 了 防止 虚假 的 规则 ， 就 需要 把 
钉子 和 螺丝 结合 到 一 个 更 宽 的 五 金 类 里 ， 并 把 木材 细 分 成 更 多 的 几 个 详细 定义 。 如 何 知道 还 
有 没有 问题 呢 ? 可 以 用 一 些 额 外 的 查询 快速 计算 一 下 每 个 项 的 销售 量 。 如 果 原 始 的 计数 很 难 
读 到 ， 那 么 新 的 OLAP 函 数 也 可 以 轻松 地 计算 出 百分比 来 。 

在 购物 篮 分 析 中 你 可 能 遇 到 的 其 他 问题 包括 你 发 现 的 一 些 规则 对 于 那个 行业 的 任何 人 来 说 
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都 是 显而易见 的 。 例 如 ， 快 餐 连锁 店 无 疑 会 发 现 肉 饼 和 煎饼 相关 。 在 系统 返回 不 合理 的 或 很 
难 解释 的 规则 时 还 会 有 一 些 狐 独 的 问题 存在 。 例 如 ， 五 金 连锁 店 发 现 马桶 圈 的 销售 和 新 店 的 
开张 关联 紧密 。 即 使 这 种 关联 是 真 的 ， 你 怎么 处 理 它 呢 ? 





让 


图 8-27 平衡 频 度 。 很 少 购买 的 项 将 导致 错误 的 规则 。 解 决 方法 是 定义 项 时 要 
平衡 。 在 这 个 例子 里 ， 把 钉子 结合 到 五 金 类 别 去 ， 并 把 木材 分 成 更 小 
的 类 


8.7.3” 聚 类 分 析 


聚 类 分 析 用 来 确定 数据 (趋向 于 彼此 有 关 的 数据 点 ) 分 组 。 它 可 以 用 来 确定 人 群 的 分 组 ， 
比如 把 顾客 归 类 。 如 果 你 知道 顾客 特定 的 组 ， 就 可 以 利用 一 些 顾 客 的 信息 来 帮 你 卖 更 多 的 东西 
给 同 组 内 的 其 他 大 。 最 有 可 能 的 是 ， 同 一 组 的 顾客 希望 买 的 东西 比较 类 似 。 例 如 ， 书 店 就 可 以 
使 用 购买 哪些 图 书 来 把 顾客 分 类 ， 并 找 出 类 似 顾客 购买 的 书 ， 再 把 它们 推荐 给 其 他 买书 人 。 同 
样 ， 可 以 使 用 聚 类 分 析 来 归 类 不 同 部 门 的 雇员 技能 ， 然 后 在 雇佣 新 工人 时 使 用 那些 信息 。 

正如 图 8-28 所 显示 的 ， 亭 类 在 二 维 情况 下 比较 容 


易 看 清 。 软 件 的 目标 就 是 识别 第 此 接近 ( 较 小 的 类 内 。 
距离 )、 而 同 基 他 数据 点 比较 远 ( 较 大 的 类 间距 离 ) 的 | ,。 ， %; 

数据 点 。 不 幸 的 是 ， 大 多 数 数据 库 没 法 像 这 个 例子 一 “| “% 字 * i 

样 有 效 地 显 式 聚 类 。 但 聚 关 分 析 仍 是 很 有 用 的 数据 探 ”次 丰 的 


测 技术 ， 因 为 它 可 以 发 现 用 其 他 工具 所 不 易 看 到 的 模 
式 。 尽 管 如 此 ， 始 终 要 记得 含 大 量 观察 结果 ( 行 ) 或 
多 维 的 数据 集 极 难 聚 类 。 就 算 用 相对 现代 的 计算 机 ， 图 8-28 聚 类 分 析 。 其 日 标 是 找到 数 . 晴 具 





评估 大 型 、 复 杂 的 问题 也 会 需要 几 小 时 到 几 天 时 间 。 ee 
所 以 要 开始 小 心 ， 要 用 较 小 的 例子 试 着 建立 诊 类 ， 而 估 起 来 非常 困难 ， 而 且 很 耗 时 
且 只 使 用 有 限 的 维 数 。 

8.7.4 地 理 分 析 


地 理 信息 系统 (GIS) 显示 涉及 地 点 信息 的 数据 。 这 些 系统 通常 归 类 为 可 视 化 系统 。 它 们 
可 以 帮助 显示 地 理 关 系 ， 给 人 们 展示 地 点 如 何 影响 数据 。 几 乎 没有 哪个 系统 真正 具有 扫描 数 
据 以 发 现 模式 的 数据 挖掘 能 力 。 虽 然 如 此 ， 它 们 还 是 数据 分 析 的 重要 工具 。 一 些 关 系 当 用 地 
图 来 看 时 更 容易 理解 。 图 8-29 就 展示 了 美国 西部 各 州 简单 的 销售 情况 。 多 用 儿 种 颜色 还 可 以 表 
示 额 外 的 数据 ， 或 者 给 每 个 州都 放 一 张 图 表 。 

大 型 的 DBMS 厂 商 已 经 开始 把 空间 和 地 理 信息 系统 结合 到 他 们 的 产品 中 去 了 。 你 也 可 以 从 
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其 他 厂商 那里 购买 单独 的 系统 。 除 了 绘制 地 图 ， 真 正 的 GIS 系 统 还 有 很 多 方法 在 地 图 上 显示 数 
据 。 基 本 的 技术 包括 阴影 与 覆盖 ， 常 用 于 按 区 域 显示 销售 。 履 盖 在 不 同 的 层 显示 多 个 项 ， 方 
便 地 看 到 各 个 项 彼此 之 间 以 及 和 地 点 之 间 的 关系 。 例 如 ， 市 场 商人 可 能 会 比较 销售 、 收 入 以 
及 不 同 地理 区 域 的 人 群 。 





图 8-29 地 理 分 析 。 基 本 的 地 图 展示 了 按 州 分 类 的 销售 情况 。 由 图 示 可 以 看 到 ， 
颜色 越 深 ， 表 示 销 量 越 多 。 如 收入 等 额外 数据 可 以 交 登 显示 ， 或 者 用 
图 表 进 行 比较 


除了 软件 ， 地 理 信息 系统 还 需要 两 个 重要 的 部 分 。 首 先 ， 需 要 地 图 信息 。 通 常 ， 这 个 数据 
是 随 分 析 系 统 二 起 卖 的 ， 但 有 时 详细 的 数据 会 作为 附加 的 项 单独 出 售 。 针 对 美国 〈 以 及 欧洲 
大 部 分 ) 的 直至 街道 的 高 清晰 数据 已 经 出 现 了 ， 但 那 是 个 很 大 的 数据 库 。 其 次 ， 需 要 对 数据 
进行 地 理 编码 ， 并 且 多 半 还 得 购买 已 经 进行 了 地 理 编码 的 人 口 统计 数据 。 本 质 上 ， 就 是 为 你 
的 数据 存储 某 种 类 型 的 地 理 标 记 。 最 基本 地 ， 你 大 概 已 经 知道 国家 和 州 ， 但 你 可 能 还 希望 添 
加 区 域 码 ， 或 者 城市 码 ， 甚 至 经 纬度 。 如 果 所 有 的 销售 数据 都 来 自 独立 的 商店 ， 就 可 以 相对 
容易 从 地 图 或 GPS 系统 中 得 到 每 家 店 的 地 理 位 置 。 随 着 手机 的 增长 ， 将 来 可 能 还 会 出 现 一 个 有 
趣 的 选择 。 按 照 联邦 应 急 条 例 〈e-911) ， 手 机 需要 有 位 置 系统 。 最 终 ， 这 种 信息 也 会 提供 给 商 
界 ， 所 以 事务 系统 也 可 以 记录 销售 员 的 精确 地 点 ， 甚 至 还 有 客户 。 请 关注 这 些 技术 造成 的 隐 
私 问题 ， 但 当 创建 新 数据 库 时 ， 应 该 考虑 把 地 理 编码 信息 结合 到 数据 表 中 。 一 旦 数据 收集 到 
了 ，GIS 就 可 以 很 方便 地 显示 其 关系 了 。 


小 结 


大 型 数据 库 是 为 事务 处 理 而 优化 的 ， 为 了 高 效 地 处 理 日 常 操作 ， 数 据 存储 在 规范 化 的 数据 
表 中 。 但 是 ， 大 多 数 经 理 需 要 连接 很 多 表 以 提取 和 理解 数据 。 索 引 加 快 了 数据 连接 和 提取 ， 
却 降低 了 事务 的 效率 。 这 种 分 歧 意 味 着 ， 创 建 一 个 分 离 的 数据 仓库 来 分 析 数 据 常常 是 更 好 的 
办 法 。 从 事务 系统 中 抽取 数据 并 清洗 ， 然 后 放 到 星 形 或 雪花 设计 中 ， 让 经 理 们 可 以 把 焦点 放 
到 一 个 特定 事实 表 周 边 的 维 上 。 
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OLAP 立 方 体 是 一 个 强大 的 工具 ， 它 让 经 理 们 可 以 快速 地 详 审 数据 ， 并 从 不 同 的 角度 检查 
部 分 和 。 不 需要 写 复 杂 的 SQL 查询 ， 经 理 们 就 可 以 跨越 产品 类 别 、 时 间 ， 甚 至 同时 跨越 多 个 维 
来 比较 值 。OLAP 立 方 体 浏 览 器 也 包含 一 些 简 单方 法 ， 用 来 过 滤 数 据 到 特定 的 行 或 立方 体 的 一 
部 分 。 

已 经 有 许多 统计 性 的 数据 挖掘 工具 被 开发 出 来 帮助 经 理 们 分 析 数 据 。 它 们 常常 需要 训练 和 
人 们 的 专业 知识 ， 但 能 成 为 理解 数据 之 间 关 系 的 强大 工具 。 分 类 和 聚 类 算法 用 来 把 数据 划分 
成 组 。 比 较 不 同 的 组 可 能 会 更 好 地 理解 客户 并 进行 市 场 扩张 。 关 联 或 购物 篮 规则 在 卖 很 多 不 
同 商品 的 商店 里 很 流行 。 找 出 同时 购买 的 商品 可 能 会 帮助 向 其 他 顾客 推荐 物品 ， 也 可 能 促进 
对 商店 布局 和 顾客 心理 的 理解 。 地 理 系 统 对 于 涉及 地 点 的 任何 问题 都 很 有 用 。 有 了 专门 的 工 
具 和 人 口 统计 数据 ， 就 可 以 用 来 查看 其 存在 的 地 理 关 系 了 。 





关键 词 
关联 规则 二 分 查找 位 图 索引 
分 类 分 析 聚 类 分 析 置信 度 
数据 挖掘 数据 仓库 维 
下 外 抽取 、 转 化 和 传输 (ETT) 事实 表 
经 纬度 代码 地 理 信息 系统 (GIS) 提升 度 
购物 篮 分 析 ，。 度量 联机 分 析 处 理 
联机 事务 处 理 轴 表 指针 
上 着 雪花 设计 星 形 设计 
超 聚 集 3 支持 度 

复习 题 


1. 在 关系 数据 库 中 ， 为 什么 索引 很 重要 ? 

2. 假定 关系 型 DBMS 很 强大 ， 公 司 为 什么 可 能 还 需要 数据 仓库 ? 
3. 建立 数据 仓库 会 磁 到 哪些 主要 问题 ? 

4. OLAP 查 询 和 传统 的 SQL 查 询 如 何不 同 ? 

5. 什么 是 OLAP 立 方 体 ?: 

6. 什么 是 分 层 的 维 ; 它们 如 何 与 上 着 和 下 钻 操作 相关 ? 

7. SQL (特别 是 新 标准 ) 中 定义 了 哪些 基本 的 分 析 函 数 ? 
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8. 数据 挖掘 的 目标 是 什么 ? 
9. 数据 挖掘 工具 主要 分 哪些 类 别 ? 


练习 


1. 至 少 找到 两 个 商用 的 OLAP 工 具 ， 并 比较 其 特性 。 

2. 找 一 个 商用 的 数据 挖掘 工具 ， 并 列 出 从 典型 DBMS 中 抽取 、 转 换 数 据 的 步骤 ， 让 它 可 以 被 
系统 所 用 。 

3. 找 一 个 商用 的 数据 挖 据 工 具 ， 并 列 出 其 执行 购物 篮 分 析 的 步骤 。 

Sally 的 宠物 商店 
下 面 问题 的 大 多 数 都 需要 一 个 OLAP 立 方 体 处 理 器 。 需 要 访问 SQL、DBMS 内 部 的 OLAP 

浏览 器 或 轴 表 。 对 于 数据 挖掘 工具 来 说 ， 如 果 没 有 专门 的 软件 ， 可 以 使 用 Excel 来 做 一 些 简单 

的 分 析 。 

4. 创建 一 个 按时 间 、 州 、 座 员 和 项 目 类 别 来 浏览 商品 销售 的 立方 体 。 

5. 创建 一 个 按时 间 、 类 别 、 品 种、 性 别 和 登记 来 浏览 动物 销售 的 立方 体 。 

6. 创建 一 个 按时 间 、 州 和 类 别 来 同时 浏览 动物 和 商品 销售 的 立方 体 。 

7. 创建 一 个 基于 时 间 、 雇 员 和 地 点 的 浏览 从 供 货 商 那里 购买 商品 的 立方 体 。 在 事实 表 里 包括 
购买 值 、 运 费 以 及 从 订单 到 接收 之 间 的 延迟 。 

8. 动物 卖 出 时 的 年 龄 和 价格 有 什么 关系 ? 

9. 如 果 你 可 以 访问 购物 复 分 析 软件 ， 评 估 一 下 销售 表 ， 看 看 是 否 存 在 什么 关联 。 

10. 作为 一 个 简单 的 时 间 序 列 分 析 ， 按 周 抽取 商品 销售 ， 把 数据 以 图 的 方式 展示 ， 然 后 估计 出 
趋势 曲线 。 

11. 一 些 类 别 的 项 的 购买 是 否 比 其 他 的 大 得 多 ? 比如， 公司 是 否 销售 了 足够 多 的 狗 ? 

12. 有 没有 购买 力 比 其 他 人 大 的 顾客 类 别 ? 这 是 个 常见 的 察 类 问题 : 如 果 你 不 能 访问 专用 的 软 
件 ， 可 以 用 回归 来 测试 各 属性 。 

13. 使 用 产品 的 周 销 售 表 ， 预 测 后 面 3 周 的 销售 情况 。 

14. 有 没有 关于 销售 的 地 理 模式 存在 ?是 不 是 一 些 州 或 者 区 域 销售 得 更 多 ? 

Rolling Thunder 自行 车 

15. 创建 一 个 按 模 型 类 型 、 州 、 时 间 和 售货员 来 评估 销售 (价值 和 数量 ) 的 OLAP 立 方 体 。 

16. 创建 一 个 新 的 尺寸 维 ， 把 车 架 维 的 尺寸 降低 到 3 个 (小 型 、 中 型 和 大 型 )。 把 自行 车 按 这 个 
维 分 类 。 如 果 可 以 的 话 ， 使 用 聚 类 软件 ， 否 则 ， 使 用 均值 和 标准 差 。 记 得 公路 自行 车 是 用 
厘米 来 计量 ， 而 山地 自行 车 用 英寸 。 

17. 把 练习 16 里 减 小 了 的 尺寸 维 添加 到 练习 15 创 建 的 OLAP 立 方 体 中 。 

18. 创建 一 个 按 定 购 日 期 (时间 )、 模 型 类 型 、 月 份 和 装配 车 架 的 雇员 来 评估 制造 用 时 的 OLAP 
立方 体 。 

19. 创建 一 个 按时 间 、 制 造 商 、 公 路 或 山地 车 以 及 部 件 类 别 来 评估 购买 组 件 的 OLAP 立 方 体 。 

20. 各 城市 的 销售 和 它 的 人 口 之 间 有 何 关系 ? 同时 从 自行 车 的 数量 和 价值 两 方面 来 评估 。 

21. 自行 车 的 尺寸 (车 架 尺 寸 ) 和 它 的 价格 之 间 有 何 关系 ? 

22. 使 用 按 模 型 类 型 分 类 的 月 销售 数据 ， 预 测 下 面 6 个 月 的 销售 情况 。 
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23. 如 果 有 购物 篮 分 析 软 件 ， 评 估 各 部 件 的 购买 情况 。 看 有 无 模式 存在 一 一 在 定义 的 组 关系 
以 外 。 

24. 创建 一 个 按 油漆 类 型 、 字 母 风 格 和 模型 类 型 来 评估 销售 (数量) 的 OLAP 立 方 体 。 

25. 忽略 资金 消耗 但 含 进 薪 水 ， 按 月 评估 利润 ， 并 预测 下 6 个 月 的 值 。 


参考 网 站 


网 站 描述 
http://otn.oracle.com/prlducts/warehouse/ Oracle 9i1 OLAP 处 理 
owb_calais_new_features/html/module4/ 

04-0110.htm 

http://www.microsoft.com/sql/evaluation/ 微软 SQL Server 2000 的 分 析 工 具 
bi/default.asp 

http://www-3.ibm.com/software/data IBM DB2 OLAP 工 具 
db2/db2olap/features.html 

http://www.wintercorp.com/rwintercolumns/ SQL 99 OLAP 标 准 和 例子 
SQL_99snewolapfunctions.html 

http://www.datawarehousing.org 数据 仓库 信息 
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第 四 部 分 





数据 库 管 理 


大 型 应 用 程序 需要 精心 地 呵护 。 绝 大 多 数 企 业 都 雇用 数据 库 管 理 员 
监控 程序 性 能 、 访 问安 全 性 ， 并 确保 数据 库 完 整 性 。 第 9 章 着 重 讲述 数 
据 管 理 员 和 数据 库 管 理 员 的 任务 ， 特 别 是 数据 库 安 全 。SQL 又 一 次 在 管 
理 和 保护 数据 库 方面 扮演 了 重要 的 角色 。 

信息 系统 (IS) 经 理 比 以 往 更 加 关注 提供 场地 无 关 的 数据 访问 问题 。 
网 络 和 Internet 提 供 了 多 种 选择 来 分 布 数据 和 给 出 贯穿 企业 的 解决 方案 。 
第 10 章 将 探讨 分 布 式 数据 库 以 及 在 Internet 上 访问 数据 库 的 一 些 挑战 和 
选择 。 





第 9 章 


数据 库 管理 与 安全 





本 章 学 习 内 容 


“数据 库 应 用 必须 执行 哪些 管理 任务 ? 

。 数 据 库 备份 会 带 来 什么 复杂 性 ? 

。 如 何 保护 数据 库 使 其 避免 物理 灾难 ? 

* 你 应 该 关注 什么 样 的 安全 威胁 ? 

。 如 何在 多 种 安全 威胁 下 保护 数据 库 ? 

9.1 开发 漫谈 

Miranda: 最 后 ， 好 像 一 切 都 运行 得 挺 好 。 

Ariel: 是 不 是 说 你 最 终 拿 到 薪水 了 ? 

Miranda: 是 啊 ， 他 们 昨天 给 了 我 支票 。 他 们 甚至 很 喜欢 我 做 的 事 ， 还 给 了 我 一 份 工 作 。 

Ariel， 好 极 了 。 你 要 接受 吗 ? 是 什么 工作 ? 

Miranda: 我 想 是 的 。 他 们 想 让 我 当 数 据 库 管理 员 。 他 们 说 需要 我 维护 这 些 数 据 库 的 正 
常 运行 。 他 们 还 瞳 示 说 想 让 我 帮 他 们 现 有 的 程序 员 们 学 习 搭建 数据 库 应 用 。 

Ariel. 哇 ! 那 意味 着 你 将 比 那些 程序 员 拿 更 多 的 钱 。 

Miranda: 大概 是 吧 。 不 过 我 必须 学 些 新 东西 。 我 确实 开始 担心 安全 了 。 财 务 经 理 昨天 
和 我 聊 了 ， 给 了 我 一 些 意料 之 中 的 有 关 销 售 系统 问题 的 想法 。 


9.2 简介 


数据 库 管理 系统 (DBMS) 的 强大 在 于 共享 数据 的 能 力 。 数 据 可 以 在 多 个 用 户 、 部 门 以 及 
应 用 之 间 共 享 。 绝 大 多 数 企 业 都 建立 了 不 止 一 个 应 用 也 不 止 一 个 数据 库 。 大 型 企业 还 可 能 需 
要 多 个 DBMS。 很 多 公司 都 同时 存在 由 不 同 小 组 开发 或 修正 的 多 个 工程 。 想 像 一 下 如 果 开 发 者 
们 可 以 随意 创建 数据 库 、 表 和 应 用 会 怎么 样 。 那 些 应 用 几乎 不 可 能 在 一 起 协同 工作 。 只 用 一 
个 DBMS 是 不 够 的 ， 想 建立 集成 应 用 的 企业 必须 要 有 人 控制 数据 和 数据 库 。 

数据 管理 包括 从 计划 、 协 调 需 求 到 定义 贯穿 公司 的 一 致 性 数据 。 必 须 有 人 或 者 小 组 负责 决 
定 应 该 收集 什么 样 的 数据 ， 数 据 怎么 存储 ， 并 提示 数据 如 何 使 用 。 这 个 人 或 者 小 组 对 数据 完 
整 性 负责 。 

数据 库 管理 包括 建立 和 运行 数据 库 的 技术 。 基 本 的 任务 就 是 性 能 监控 、 备 份 和 恢复 ， 并 且 
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分 配 和 控制 安全 。 数 据 库 管理 员 应 在 安装 、 配 置 和 运行 DBMS 的 细节 方面 受过 训练 。 

数据 库 安 全 是 计算 机 安全 话题 的 一 个 子 集 。 尽 管 如 此 ， 由 于 数据 共享 的 目标 ， 安 全 在 数据 
库 管理 中 是 一 个 非常 重要 的 问题 。 同 时 ， 所 有 的 应 用 开发 者 和 数据 库 管理 者 都 应 该 学 学 数据 
库 安全 中 一 些 有 意思 的 特性 。 如 果 数 据 库 安全 合理 分 配 ， 可 以 减少 许多 类 型 的 欺诈 。 如 果 数 
据 库 安全 被 忽略 或 者 性 能 很 差 ， 这 个 公司 的 主要 资产 可 能 被 世界 上 任意 一 家 公司 操纵 或 盗 取 。 
理解 安全 问题 并 适当 处 理 是 非常 值得 的 。 


9.3 数据 管理 员 


数据 是 公司 的 重要 资产 。 设 想 一 下 如 果 当 一 个 公司 的 全 部 计算 机 受到 毁坏 或 者 所 有 数据 丢 
失 ， 它 还 能 生存 多 久 。 一 些 企业 或 许 能 存活 几 天 或 一 周 ， 而 很 多 将 会 立即 破产 ， 比 如 银行 。 

公司 应 该 在 丢失 任何 数据 前 就 意识 到 数据 中 包含 的 信息 。 如 图 9-1 所 示 ， 公 司 因 不 同 的 目 
的 会 有 很 多 不 同 的 数据 库 。 随 着 时 间 的 推移 ， 各 企业 建立 了 很 多 不 同 的 数据 库 和 应 用 来 支持 
他 们 可 操作 的 、 战 术 或 战略 决策 。 每 一 个 应 用 自身 都 很 重要 ， 但 是 ， 当 这 些 应 用 和 数据 库 协 
调 工作 并 交换 数据 时 ， 管 理 者 才能 得 到 整个 企业 一 个 完整 的 画面 。 





图 9-1 数据 管理 。 在 众多 工程 和 开发 者 之 间 ， 数 据 管理 员 通过 协调 各 项 目 让 数 
据 可 以 跨 应 用 地 集成 起 来 

不 管 数据 库 系统 多 么 强大 和 灵活 ， 不 同时 间 由 不 同人 建立 的 应 用 不 会 自动 共享 数据 。 数 据 
集成 的 关键 乃 是 让 某 个 人 管理 整个 公司 的 数据 资源 。 绝 大 多 数 公司 里 ， 数 据 管理 员 (DA) 充 
当 这 个 角色 。 

如 图 9-2 总 结 的 ，DA 的 主要 任务 就 是 提供 整个 企业 数据 的 集中 控制 。DA 建 立 数据 定义 标 
准 ， 保 证 所 有 应 用 都 使 用 一 致 的 格式 和 命名 惯例 。DA 协 调 各 应 用 和 小 组 ， 保 证 不 同 工 程 的 数 
据 可 以 集成 到 覆盖 全 公司 的 信息 系统 中 。 如 果 开 发 者 和 管理 者 之 间 有 争论 发 生 ，DA 就 充当 裁 
判 ， 制 定 决 策 保持 整个 公司 的 一 致 性 。DA 同 时 监控 数据 库 产 业 、 观 察 技 术 趋 势 ， 然 后 给 出 为 
了 长 期 利益 ， 考 虑 应 该 使 用 什么 数据 库 系统 和 工具 的 建议 。 

在 提议 方面 DA 扮演 了 一 个 至 关 重 要 的 角色 。 大 多 数 管理 者 和 许多 开发 者 都 不 知道 现代 数 
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据 库 系统 的 强大 和 功能 。 通 过 理解 管理 任务 和 数据 库 的 能 力 ，DA 应 该 对 新 应 用 提出 建议 ， 并 
扩展 现 有 数据 的 使 用 范围 。 


“提供 数据 的 集中 控制 
数据 定义 ， 格 式 和 命名 惯例 
数据 集成 
DBMS 选 择 


“担当 数据 和 数据 库 的 提倡 者 
应 用 思想 
决策 支持 
策略 使 用 

“协调 数据 一 致 性 、 安 全 、 隐 私 和 控制 





图 9-2 数据 管理 员 的 任务 。DA 负 责 维护 数据 的 质量 以 及 为 整个 企业 集成 数据 。 
DA 同时 还 倡导 使 有 数据库， 并 常常 进行 安全 控制 

最 终 ，DA 还 负责 数据 的 完整 性 : DBMS 中 包括 的 数据 真 的 是 公司 真实 情形 的 描述 吗 ? 公 
司 是 否 有 合适 的 系统 和 恰当 的 控制 来 保证 数据 的 正确 性 和 适时 性 ? 

DA 职位 更 多 意义 上 是 份 管理 工作 。DA 的 任务 包括 了 组 织 和 控制 应 用 开发 的 设计 。 控 制 要 
靠 建立 标准 、 监 控 开 发 和 变化 ， 以 及 提供 数据 库 设计 的 援助 来 维持 。DA 同 样 要 花 时 间 和 事务 
管理 者 评估 当前 系统 ， 监 控 事务 趋势 ， 确 定 未 来 的 需求 。 这 个 职位 的 雇员 通常 都 有 若干 年 设 
计数 据 库 的 经 验 ， 并 且 需 要 对 这 个 公司 的 细节 知识 很 熟悉 。DA 还 需要 数据 库 的 技术 知识 来 理 
解 不 同 存储 对 决策 意味 着 什么 ， 还 必须 能 够 与 技术 管理 员 和 事务 管理 员 保持 良好 的 沟通 。 


9.4 数据 库 管 理 员 


DBMS 是 一 个 复杂 的 软件 包 。 安 装 、 运 行 和 升级 DBMS 都 不 是 简单 的 事情 。 即 使 是 基于 个 
人 计算 机 系统 ， 这 些 任务 也 需要 一 个 专职 员工 来 负责 。 每 个 数据 库 需 要 一 个 数据 库 管 理 员 
(DBA) 来 管理 。DBA 这 个 职位 通常 由 一 个 在 某 特定 DBMS 上 受过 训练 的 专家 来 充当 。 在 较 小 
的 公司 里 ， 某 个 开发 带头 人 可 能 会 被 要 求 履 行 DBA 的 职责 ， 而 不 是 雇用 一 个 专家 。 

DBA 的 任务 更 具有 技术 性 。 图 9-3 重 点 指出 ，DBA 的 职责 包括 安装 和 升级 DBMS 。 其 他 任 
务 包括 创建 用 户 账户 和 监控 安全 ， 还 要 负责 管理 备份 。 尽 管 实际 的 备份 任务 可 能 会 由 系统 管 
理 员 执行 ，DBA 也 要 负责 设 定 进度 表 ， 确 保 数 据 备份 的 安全 。DBA 同 时 监控 数据 库 性 能 ， 计 
划 升 级 等 。DBA 必 须 保持 和 DBMS 厂 商 的 联系 ， 跟 踪 系 统 问 题 ， 系 统 有 变 能 随时 得 到 通知 。 
如 果 出 现 了 新 的 工具 、 信 息 ，DBA 则 像 一 个 联络 员 ， 收 集 这 些 信息 并 提供 给 开发 者 。DBA 有 
着 对 应 用 数据 完全 的 访问 权 。 许 多 企业 里 ，DBA 控 制 着 每 个 数据 库 的 安全 。 大 型 公司 可 能 还 
会 任命 一 个 特别 的 安全 员 制 定 方针 、 程 序 来 帮助 监控 。 尽 管 如 此 ，DBA 通 常 负责 执行 数据 库 
安全 分 配 权限 的 技术 细节 。 

数据 分 配 和 存储 是 DBA 日 常 工作 的 一 项 重要 任务 。 一 些 大 型 数据 库 系 统 需要 DBA 为 每 个 
数据 库 提 前 指定 一 块 磁盘 空间 。 一 些 系 统 利 用 创建 数据 文件 和 表 室 间 来 分 配 物理 空间 ， 这 里 
表 空 间 是 数据 可 以 存储 空间 的 逻辑 集合 。 
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"安装 和 升级 DBMS 
。 创建 用 户 账户 和 监控 安全 
“管理 数据 库 备份 和 恢复 


“监控 和 调节 数据 库 性 能 
“与 DBMS 供 应 商 协调 并 为 改变 做 计划 
"为 开发 者 维护 特定 DBMS 的 相关 信息 





图 9-3 数据 库 管理 员 的 任务 。DBA 的 任务 相当 偏 技术 ， 需 要 每 日 监控 ， 并 对 
DBMS 做 出 更 改 

通常 数据 表 ， 索引 和 事务 日 志 都 分 配 有 独立 的 空间 ，DBA 必 须 估计 每 种 组 件 的 大 小 。 如 
果 DBA 分 配 的 空间 太 少 了 ， 性 能 就 会 受 影响 ， 另 一 面 ， 分 配 太 多 空间 意味 着 公司 会 为 不 必要 
的 磁盘 容量 浪费 金钱 。 绝 大 多 数 系统 都 提供 追加 空间 的 工具 ， 但 最 好 还 是 预先 估计 。 第 3 章 讲 
过 的 数据 量 提供 了 确定 空间 需求 的 重要 信息 。 对 于 表 来 说 ， 主 要 的 概念 就 是 确定 表 的 平均 行 
宽 ( 按 字 节 )， 乘 以 表 的 期 望 行 数 。 注 意 每 个 DBMS 存 储 数据 各 有 微小 差异 ， 有 的 在 存储 的 每 
行 多 加 一 些 字 节 。 文 档 会 提供 各 DBMS 的 细节 。 更 精准 的 办 法 是 建立 一 个 临时 数据 库 ， 在 每 个 
表 中 创建 若干 行 ， 然 后 用 实际 的 平均 空间 来 估计 未 来 的 需求 。 索 引 和 回 滚 日 志 需 要 的 空间 取 
决 于 具体 的 DBMS 和 计算 机 系统 。 如 果 需 要 精确 的 估计 ， 则 必须 参考 特定 DBMS 的 文档 和 支持 
工具 。 索 引 和 日 志 的 空间 需求 还 取决 于 应 用 所 定义 的 事务 数目 和 长 度 。 例 如 ， 在 一 个 执行 事 
务 处 理 的 数据 库 中 ， 事 务 日 志 将 肯定 比 主要 用 于 决策 支持 和 数据 提取 的 数据 库 大 的 多 。 


9.5 数据库 结构 


DBA 的 工作 是 数据 库 结构 的 基础 。 尽 管 每 种 DBMS 都 有 微小 的 差异 ， 图 9-4 展 示 了 由 SQL 
标准 定义 的 数据 库 的 一 个 全 面 架构 。 用 户 由 独立 的 数 

据 库 实例 定义 ， 并 由 DBA 授 予 权限 。 模 式 是 一 个 容器 ， 数据 库 

作为 一 个 名 字 空 间 以 避免 表 的 重 名 。 最 初 ， 定 义 后 每 
个 用 户 都 有 一 个 独立 的 空间 来 建 表 。 两 个 用 户 可 以 创 
建 同 样 命名 为 Employee 的 表 而 不 会 引发 问题 。 今 天 ， 
模式 可 以 为 任意 目的 创建 ， 而 不 只 是 为 每 个 用 户 。 目 
录 由 SQL99 标 准 提出 ， 通 过 把 模式 放 到 同一 个 容器 里 ， 
主要 是 为 了 使 查找 和 访问 相关 模式 更 加 容易 。 在 这 点 
上 ， 并 不 是 任意 DBMS 都 支持 目录 元 素 。 但 是 ， 模 式 
方法 相对 通用 得 多 。 用 户 和 应 用 分 配 到 默认 模式 ， 屠 
个 模式 下 的 表 和 视图 都 可 以 直接 访问 (当然 还 取决 于 OO 
安全 许可 )。 可 是 ， 有 时 候 需 要 访问 不 同 模式 下 的 表 或 ”图 9- 结构 。 他 元 素 能 
视图 。 这 种 情况 下 ， 就 需要 用 全 名 。 全 名 包括 模式 名 有 
(最 终 是 目录 名 )。 举 个 例子 ， 如 果 要 访问 Corporate 模 式 下 的 Employee 表 ， 需 要 使 用 SELECT * 
FROM Corporate Employee 来 指示 表 的 全 名 。 如 果 需 要 指定 目录 (比如 Main) ， 就 需要 用 
Main.Corporate.Employee 作 为 表 的 全 名 。 像 表 、 视 图 、 触 发 器 这 些 标准 的 数据 库 元 素 都 可 用 于 
每 个 模式 。DBA (和 DA) 的 一 项 任务 就 是 确定 何 时 创建 新 的 模式 。 尽 管 没有 具体 的 规则 ， 也 
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要 记 住 模式 的 目的 是 隔离 和 划分 应 用 。 
9.6 元 数据 


每 个 厂商 都 会 提供 工具 帮助 DBA 完 成 常见 任务 。 大 多 会 有 一 个 面向 图 形 化 的 方法 来 简化 
使 用 。 另 一 方面 ，DBA 常 常 选择 使 用 SQL， 通 过 建立 特定 过 程 来 完成 任务 。SQL 命 令 提供 操作 
的 详细 控制 ， 而 且 可 以 写成 一 次 处 理 数 十 或 上 百 个 操作 的 形式 。 例 如 ， 图 形 方法 对 于 增加 一 
个 用 户 来 说 比较 简便 ， 可 是 如 果 要 增加 100 个 用 户 ， 那 么 写 一 个 从 文件 或 临时 表 读 取 用 户 的 
SQL 过 程 则 更 为 简单 。 

在 管理 上 ， 关 系数 据 库 系统 强大 的 方面 之 一 就 是 ， 其 至 管理 用 的 数据 也 是 存放 在 表 中 。 这 
种 元 数据 就 是 数据 的 数据 。 例 如 ， 一 个 系统 表 包 含 了 所 有 用 户 表 的 列表 。SQL99 标 准 描述 的 
Information_Schema 包 含有 提供 数据 库 文档 信息 的 一 组 视图 。 从 技术 上 讲 ，Information_ 
Schema 视图 从 Definition_Schema 表 中 提取 数据 ， 但 是 ，DBMS 厂 商 可 能 并 不 实现 
Definition_Schema。DBMS 厂 商 已 经 开发 出 了 自 有 的 系统 表 存 放 元 数据 。 这 种 方法 的 缺点 是 没 
有 跨 产 品 的 一 致 性 ， 所 以 DBA 们 必须 为 每 种 DBMS 学 习 不 同 的 命令 。 随 着 厂商 们 实现 新 的 标 
准 ，DBA 将 会 发 现 工作 于 来 自 不 同 厂商 的 产品 变 得 容易 了 。 

图 9-5 显 示 了 一 些 Information_Schema 的 通用 元 素 。SQL 命 令 展示 了 如 何 基于 名 字 获 得 表 
的 部 分 列表 。 当 数据 库 含 有 数 百 个 表 和 视图 时 ， 这 种 命令 形式 就 有 用 得 多 了 。 可 以 利用 SQL 
的 强大 而 快速 找到 需要 的 表 ， 而 不 需要 在 数 十 页 的 指定 表 中 来 回 翻 动 。 在 这 个 例子 中 ， 必 须 
总 是 提取 出 Table_Type 和 它 的 名 字 。 表 可 能 是 基本 类 型 (真正 存放 数据 的 ) 、 视 图 ， 或 者 导出 
的 表 。 


Schemata 

Tables 

Domains 

Views SELECT Table_Name, Table_Type 
Table_privileges FROM Information Schema.Tables 


Referential_ Constraints WHERE table name LIKE ‘Emp%’ 
Check_Constraints 

Triggers 

Trigger_Table_Usage 

Parameters 

Routines 





图 9-5 Definition_Schema。 标 准 中 61 种 视图 中 的 一 部 分 在 左边 列 出 。 示 例 查 询 
显示 DBA 如 何在 元 数据 视图 中 快速 找到 特定 的 项 目 


9.7 开发 阶段 的 数据 库 任务 


不 管 你 采用 什么 开发 方法 (就 是 说 , 传统 的 系统 开发 生命 周期 、 快速 开发 、 还 是 原型 开发 )， 
每 一 步 都 有 特定 的 数据 库 任 务 。 这 些 任务 的 大 部 分 都 由 应 用 开发 者 完成 。 有 些 需 要 和 DA 进行 
协调 。 很 多 任务 都 需要 和 DBA 交 流 ， 获 得 建议 ， 提 供 信息 ， 帮 助 DBA 建 立 数据 库 。 
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9.7.1 数据 库 规划 


在 可 行 性 和 规划 阶段 ， 必 须 对 数据 存储 需求 做 一 个 估计 。 这 些 最 初 的 估计 可 能 很 粗糙 ， 但 
可 以 帮助 确定 支持 应 用 所 需 的 硬件 大 小 和 容量 。 例 如 ， 如 果 只 是 建 一 个 跟踪 5 个 人 资料 的 简单 
数据 库 ， 那 么 这 个 数据 库 只 需要 小 于 100 兆 字 节 的 存储 ， 运 行 在 个 人 计算 机 上 。 如 果 最 初 的 大 
小 估计 都 超过 数 百 兆 字 节 的 存储 ， 一 个 带 高 速 磁盘 驱动 器 的 文件 服务 器 可 能 更 为 适合 。 随 着 
数据 库 估 计 达 到 了 千 兆 或 者 万 亿 字 节 ， 就 得 采用 特殊 的 数据 库 硬 件 和 并 行 处 理 系统 了 。 

最 初 的 调研 还 应 该 提供 关于 需要 的 表单 和 报表 数量 的 要 求 以 及 其 复杂 性 。 这 些 数 字 将 用 来 
估计 系统 开发 的 时 间 和 成 本 。 一 个 有 经 验 的 DBA 可 以 从 类 似 的 工程 中 估计 出 空间 需求 。 公 司 
在 其 他 工程 上 的 记录 可 以 提供 生成 表单 和 报表 的 平均 时 间 估计 。 


9.7.2 数据 库 设计 


设计 阶段 的 基本 目标 就 是 了 解 用 户 需 求 ， 设 计 出 合适 的 数据 表 。 数 据 规范 化 是 这 个 阶段 中 
数据 库 相 关 工 作 的 主要 活动 。 最 终 的 表 定义 也 将 对 存储 需求 提供 更 好 的 估计 。 
合作 协调 和 项 目 管理 是 这 个 阶段 的 重要 管理 任务 。 











如 图 9-6 强 调 的 ， 合 作 由 DA 定义 的 数据 标准 所 支持 。 工 合作 

程 可 以 分 成 块 ， 分 配给 各 个 组 成 员 。 标 准 和 交流 提供 了 人 

把 块 集中 成 一 个 完整 应 用 的 能 力 。 交 流通 过 共享 的 数据 可 重用 的 对 象 
资源 、 网 络 工具 、 电 子 邮 件 以 及 计算 机 辅助 软件 工程 CASE 工 具 
(CASE) 等 手段 得 到 加 强 。 主 流 的 CASE 工 具 包括 网 络 和 通信 
Oracle Designer/2000，Rational Rose，IEF 和 IBM 的 和 
Visual Age。 这 些 工具 为 包括 图 表 、 数 据 定义 和 程序 纺 通过 用 户 视图 规范 化 
码 等 所 有 的 工程 工作 提供 了 一 个 集中 式 的 仓库 。 组 成 员 分 配 表单 和 报表 


在 属于 他 们 自己 那 部 分 工程 块 上 工作 时 ， 可 以 看 到 工程 一 一 
的 其 他 部 分 。 在 面向 对 象 工程 中 ， 他 们 可 以 使 用 其 他 组 “图 9-6 管理 数据 库 设 计 。 数 据 库 设计 需 


要 合作 和 标准 来 确保 各 个 模块 能 
创建 的 对 象 。 集中 成 完整 的 应 用 。CASE 工 具 
从 数据 设计 或 规范 化 的 观点 看 ， 工 程 常常 通过 分 配 和 网 络 通过 一 个 集中 式 的 设计 数 
F DA 
表单 和 划分 报表 给 单独 的 组 成 员 。 然 后 每 个 人 负责 确定 据 的 储藏 库 来 加 强 交流 


业务 假设 以 及 定义 那些 分 配 的 表单 所 需要 的 规范 化 表 。 各 开发 者 周期 性 地 把 他 们 的 工作 合 到 
一 块 儿 ， 创 建 出 一 个 集中 式 的 将 用 到 数据 库 中 的 表 清 单 。 这 个 最 终 的 清单 必须 遵循 DA 建立 的 
标准 。 


9.7.3 数据 库 实现 


数据 库 实现 所 需 的 重点 任务 由 图 9-7 列 出 。 应 用 和 用 户 界面 的 开发 是 主要 步骤 。 管 理 和 企 
业 的 任务 很 大 程度 上 要 求 确定 应 用 的 总 体 观感 。 一 旦 整体 架构 确定 ， 编 程 标准 和 测试 过 程 将 
利于 合作 和 保证 质量 。 

另 一 个 重要 的 管理 任务 是 分 配 不 同 数据 库 的 所 有 权 。 所 有 者 应 该 来 自 业 务 管理 中 。 数 据 所 
有 者 要 负责 确定 主要 的 安全 规则 ， 并 验证 数据 的 准确 性 。 如 果 DBA 对 访问 权限 或 者 数据 的 改 
动 有 疑问 ，DBA 可 以 从 数据 所 有 者 获取 额外 信息 和 建议 。 
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意 组 件 失败 , 数据 库 日 志 应 该 完全 能 恢复 数据 。 用 户 界面 
备份 常常 用 两 种 方式 处 理 ， 在 预定 义 的 检查 点 程序 结构 
进行 全 备份 ， 对 最 后 一 次 全 备份 后 发 生 的 变化 各 放量 和 对 旬 
、 、 2 过 
进行 增 量 式 备份 。 完 全 备份 更 容易 饮 复 ， 更加。 | ， 如 访 汪 和 所有 权 
安全 , 但 是 很 耗 时 间 ， 也 需要 大 量 的 备份 空间 。 。 载 人 数据 库 
对 于 小 型 数据 库 ， 全 备份 不 是 问题 。 对 于 大 型 、 * 备份 和 恢复 计划 
连续 变化 的 事务 数据 库 ， 或 许 只 有 可 能 一 周 左 | "用户 和 扣 作 训练 
全 次 全 备 从 。 图 9-7 实现 管理 。 必 须 细心 选择 用 户 界面。 编程 标 
i ~ 。 人 儿 人 o 双 
用 户 和 操作 员 同样 需要 训练 。 不 管用 广 加 准 和 测试 过 程 有 助 了 保证 各 组 件 之 闻 的 妆容 
面 设计 得 多 么 仔细 ， 也 总 是 需要 为 用 户 提供 一 ”性 ， 并 提供 质量 控制 。 业 务 管理 者 应 该 分 本 
个 至 少 是 入 门 培训 的 课程 。 类 似 地 ， 计 算 机 操 数据 的 所 有 权 ， 便 于 他 们 对 于 安全 条 件 和 原 
en 量 做 出 最 终 决 定 。 必 须 创建 和 测试 备份 、 恢 
作 员 可 能 需要 在 备份 和 恢复 上 进行 培训 ， 复 计划 。 对 操作 员 和 用 户 必须 创建 训练 程序 


9.7.4 ”数据 库 运行 和 维护 


一 旦 数据 库 投 入 运行 ，DBA 将 完成 绝 大 部 分 任务 。 关 键 的 任务 有 :(1) 监控 使 用 和 安全 
性 ， (2) 进行 备份 和 恢复 ， (3) 支持 用 户 。 

监控 性 能 和 存储 空间 是 管理 一 个 数据 库 的 紧要 因素 。 监 控 常 常用 于 调整 应 用 性 能 以 及 估算 
增长 并 计划 将 来 的 需求 。 安 全 访问 和 变化 也 同样 被 监控 。 安 全 日 志 可 以 跟踪 关键 数据 的 变化 ， 
也 可 以 在 出 现 疑 问 时 跟踪 某 个 用 户 的 使 用 (包括 读 和 写 )。 

监控 性 能 和 用 户 问题 对 系统 提供 了 有 用 的 反馈 。 如 果 用 户 都 在 某 个 地 方 出 现 现 问 题 ， 就 促使 
开发 小 组 改善 那里 的 表单 。 类 似 地 ， 如 果 一 些 用 户 运行 的 查询 花费 了 很 长 时 间 来 执行 ， 就 该 
找 设计 小 组 来 为 这 些 查询 创建 更 加 高 效 的 程序 。 例 如 ， 不 要 期 望 用 户 辨认 出 或 更 正 一 个 相关 
子 查询 。 相 反 ， 如 果 DBA 看 到 用 户 运行 需要 很 长 时 间 运 算 的 复杂 查询 ， 小 组 就 该 给 应 用 中 增 
加 一 个 新 的 部 分 来 存储 和 执行 一 个 更 有 效 的 查询 。 

类 似 地 ， 如 果 一 些 人 使 用 数据 库 的 某 个 部 分 非常 频繁 ， 那 么 可 能 给 他 们 一 份 那个 主要 部 分 
的 副本 更 为 高 效 些 。 如 果 用 户 不 需要 最 新 的 数据 ， 可 以 在 服务 器 上 建 一 个 小 数据 库 ， 每 夜 更 
新 。 这 样 用 户 将 最 终 得 到 更 快 的 响应 时 间 ， 因 为 他 们 有 小 数据 库 且 需要 更 少 的 通信 时 间 。 数 

据 库 剩 下 的 部 分 也 将 运行 更 快 ， 因 为 频繁 用 户 少 了 。 

数据 库 厂 商 提 供 强 大 的 工具 来 帮助 分 析 查 询 和 数据 库 性 能 。 利 用 这 些 工具 ， 可 以 分 离 整 个 
查询 过 程 ， 精 确 地 观察 哪 步 占用 了 最 多 的 时 间 。 有 了 这 些 知识 ， 开 发 者 就 可 以 换 一 种 方案 来 
避免 瓶颈 。 其 他 一 些 工具 可 以 监控 死 锁 和 事务 问题 ， 也 让 修正 问题 变 得 相对 容易 。 调 束 一 个 
大 型 数据 库 来 提高 性 能 是 个 复杂 的 问题 ， 且 严重 依赖 于 特定 DBMS 的 功能 和 工具 。 


9.8 备份 和 恢复 


可 能 最 关键 的 数据 库 管理 任务 就 是 备份 了 。 不 管 规划 得 多 好 ， 也 不 管 安全 系统 多 么 精密 ， 
也 总 会 出 错 。 数 据 库 管理 者 和 开发 者 有 义务 为 灾难 做 出 计划 。 计 划 中 最 关键 的 方面 则 是 确保 
可 以 很 容易 访问 到 数据 库 的 当前 副本 。 任 何 类 型 的 灾难 一 一 火灾 、 洪 水 、 妨 怖 袭击 、 能 量 不 足 、 
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计算 机 病毒 、 磁 盘 毁 坏 或 意外 删除 一 -都 需要 备份 数据 。 假 如 制作 和 存储 备份 的 成 本 不 高 ， 就 
没有 理由 不 在 任何 时 候 都 有 一 份 可 用 的 当前 备份 。 

如 图 9-8 显 示 ， 数 据 库 备 份 提出 了 一 些 有 意思 的 挑战 一 -尤其 是 当 数 据 库 必须 每 天 24 小 时 、 
每 周 7 天 (简称 24-7) 工作 时 。 基 本 的 问题 就 是 当 数据 库 正 在 备份 时 ， 数 据 的 改变 仍 在 发 生 。 
就 是 说 ， 数 据 库 的 每 个 副本 都 立即 失效 一 一 即使 正在 制作 时 。 一 个 相关 的 问题 是 ， 有 可 能 数据 
库 中 DBMS 的 副本 例 行 程序 需要 等 待 的 那 部 分 正在 使 用 中 〈 很 可 能 造成 死 锁 情形 ) 。 

幸运 的 是 ， 较 大 的 数据 库 系 统 都 提供 了 很 多 工具 来 解决 这 些 问 题 。 大 多 数 情况 下 DBMS 取 
各 表 的 一 个 快照 (snapshot) 。 快 照 表 示 表 在 某 时 刻 的 状态 。 然 后 数据 库 对 最 后 一 次 快照 后 的 
所 有 改变 都 维护 一 个 事务 日 志 。 

变化 





图 9-8 变化 中 的 数据 库 备 份 。 备 份 程序 在 某 时 间 点 上 取 一 个 快照 。 新 的 变化 都 
存在 流水 账 或 目 志 中 。 恢 复 程 序 载 和 快照 并 增加 或 删除 日 志 中 的 变化 


未 决 的 是 DBA 必 须 决定 多 长 时 间 进 行 一 次 增 量 式 (部 分 ) 备份 以 及 多 长 时 间 需 要 进行 一 
次 全 备份 (快照 ) 。 部 分 备份 创建 得 更 快 ， 且 需要 的 存储 空间 更 少 ， 但 是 在 灾难 中 需要 更 长 的 
时 间 来 恢复 。 

如 果 出 现 问题 , 数据 库 就 必须 从 备份 磁带 中 得 到 恢复 。 首 先 ， DBMS 载 人 最 新 的 快照 数据 ， 
然后 检查 事务 。 完 成 事务 回 深 ， 变 化 被 重新 写 回 到 数据 表 中 。 如 果 备 份 发 生 在 事务 中 间 ， 而 
事务 并 未 完成 ，DBMS 就 会 回 滚 或 移 去 最 初 的 改变 ， 并 重启 事务 。 要 记得 事务 包含 的 一 系列 改 
变 必 须 全 部 成 功 或 者 三 起 失败 。DBMS 依 赖 于 第 7 章 描述 事务 的 应 用 定义 。 

备份 必须 按 周期 性 的 时 间 表 来 执行 。 有 了 时候 ， 时 间 表 需要 修改 一 -特别 当 数 据 库 记录 改变 
较 多 时 。 要 知道 自 最 后 一 次 备份 以 来 的 任何 更 改 都 存在 流水 账 或 事务 日 志 中 。DBA 必 须 观 察 
事务 日 志 的 空间 。 如 果 太 满 了 ， 备 份 程序 就 得 提早 进行 。 如 果 这 些 非 期 望 的 备份 发 生得 太 频 
繁 ， 就 该 修改 时 间 表 了 。 

备份 磁带 必须 存放 在 别处 。 否 则 , 一 场 大 火 或 其 他 灾难 有 可 能 毁 掉 建筑 内 所 有 存储 的 数据 。 
快照 和 流水 账 日 志 起 码 应 该 每 天 复制 到 别处 去 。 如 果 公司 比较 大 ， 能 支持 不 止 一 个 地 点 的 计 
算 机 工具 ， 那 么 网 络 将 使 传送 数据 更 加 容易 。 不 少 公司 都 有 抗灾 难 的 储藏 室 来 存放 数据 磁带 
和 磁盘 。 在 极端 情况 下 ， 可 能 都 值得 拥有 双 份 计算 机 资源 ， 且 有 编制 的 程序 让 系统 自动 把 主 
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数据 库 的 改变 映像 到 不 同 地 点 的 备用 计算 机 上 。 当 出 现 事 故 时 ， 备 份 计算 机 可 以 立即 接 过 操 
作 。 但 是 ， 即 使 在 这 种 情况 下 ， 都 必须 制作 物理 备份 。 


9.9 安全 和 隐私 


计算 机 安全 是 当今 每 个 公司 都 面临 的 问题 ， 任 何 计算 机 应 用 都 面临 安全 问题 。 数 据 库 在 一 
个 地 方 聚 集 了 大 量 数据 让 人 们 更 加 容易 地 获取 和 修改 。 换 句 话 说， 数据 库 是 必须 保护 的 关键 
资源 。 然 而 让 数据 库 如 此 有 用 的 因素 同样 决定 了 更 难保 证 其 安全 性 。 特 别 地 ， 数 据 库 的 目标 
就 是 共享 数据 。 从 安全 的 角度 讲 ， 你 要 控制 谁 能 分 享 数据 以 及 那些 用 户 能 做 什么 。 

计算 机 安全 有 两 个 基本 类 别 : (1) 物理 安全 ，(2) 逻辑 安全 。 物 理 安全 关注 物理 性 地 保 
护 计 算 资 源 ， 以 及 为 可 能 损坏 的 设备 和 数据 的 物理 灾难 做 准备 。 远 辑 安 全 包括 保护 数据 和 控 
制 数据 访问 。 


9.9.1 数据 隐私 


隐私 和 安全 相关 ， 但 有 一 些 细微 的 差异 。 公 司 和 政府 机 构 收集 客户 、 供 应 商 和 雇员 的 大 量 
资料 。 隐 私 指 的 是 控制 这 些 数据 的 流传 ， 并 尊重 这 部 分 人 群 的 意愿 。 图 9-9 展 示 了 一 些 对 商业 
数据 的 要 求 ， 而 这 些 数 据 是 和 市 场 、 雇 员 管 理 、 政 府 需 求 相 关 的 。 维 护 这 些 数据 的 正确 性 以 
及 限制 谁 有 权 访 问 它 们 ， 这 些 概念 对 安全 和 隐私 来 说 是 一 致 的 。 在 安全 方面 ， 每 家 公司 都 有 
保护 自身 数据 安全 的 自身 利益 。 在 隐私 方面 ， 至 少 在 美国 ， 很 少 有 哪个 公司 有 私人 数据 操作 
的 规则 或 限制 。 然 而 ， 客 户 和 雇员 可 能 希望 公司 保持 自己 资料 的 隐私 性 ， 而 公司 却 可 能 因 金 
融 利 益 的 驱动 把 这 些 数据 交换 或 者 卖 给 其 他 公司 。 





图 9-9 隐私 。 收 集 和 分 析 数 据 有 很 多 理由 。 人 们 可 能 会 觉得 一 些 理由 很 有 侵犯 
性 。 尽 管 几乎 没有 隐私 法 律 存 在 ， 商 家 和 数据 库 管 理 员 还 是 应 该 在 造成 
影响 和 使 用 这 些 数据 中 寻求 一 个 平衡 


在 数据 隐私 方面 ， 最 重要 的 问题 就 是 ， 谁 拥有 数据 ? 绝 大 多 数 情 况 下 答案 是 收集 数据 的 公 
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司 或 个 人 。 一 部 分 人 ， 尤 其 是 在 欧洲 ， 建 议 应 该 考虑 把 个 人 作为 拥有 者 。 然 后 公司 必须 获得 
许可 ,或 者 购买 许可 ， 才 能 使 用 或 者 交换 个 人 数据 。 到 目前 为 止 ， 技术 的 局 限 性 阻止 了 大 多 
数 这 种 付费 模式 的 实现 。 但 是 ， 公 司 必须 关注 有 关 隐 私 的 法 律 。 

数据 库 管理 员 在 数据 隐私 方面 负 有 道义 责任 。 很 多 时 候 你 有 权限 访问 到 关于 客户 和 其 他 和 雇 
员 的 私人 数据 ， 但 你 有 义务 维持 这 些 数 据 的 隐私 ;你 不 能 把 这 些 数据 暴露 给 其 他 人 。 事 实 上 ， 
你 应 该 尽量 避免 读 取 这 些 数据 。 你 同样 不 该 容忍 企业 内 其 他 工人 对 这 些 数据 的 滥用 。 如 果 你 
监测 到 隐私 (或 安全 ) 被 其 他 人 侵犯 ， 你 应 该 报告 问题 ， 并 通知 合适 的 上 级 主管 。 


9.9.2 威胁 


计算 机 安全 的 主要 威胁 有 哪些 ?什么 样 的 可 能 事件 将 造成 数据 库 管理 员 的 圳 梦 ? 是 你 在 电 
影 里 看 到 的 外 面 的 黑客 或 者 解密 高 手 吗 ? 它 是 旋风 、 飚 风 还 是 地 震 (电影 里 也 很 常见 ) ? 

都 不 是 。 任 何 公 司 的 主要 威胁 都 来 自 “ 内 部 ”。 公 司 可 以 为 其 他 所 有 威胁 制定 计划 ， 而 且 
有 各 种 各 样 的 工具 来 帮助 最 小 化 问题 。 但 是 ， 你 必须 相信 你 的 和 雇员、 顾问 和 商业 伙伴 。 为 了 
让 他 们 工作 ， 他 们 需要 对 你 的 计算 机 有 物理 的 访问 权 ， 对 数据 库 有 逻辑 的 访问 权 。 一 旦 你 决 
定 赋予 权限 ， 再 控制 他 们 的 行为 就 难 了 。 并 非 不 可 能 ， 而 是 更 困难 。 

另 一 面 ， 更 多 阴险 的 威胁 来 自 有 意 破坏 数据 的 程序 员 。 有 一 项 技术 ， 可 以 在 程序 里 嵌入 时 
间 炸 弹 。 时 间 炸 弹 需 要 程序 员 每 天 输入 一 个 秘密 代码 。 如 果 程 序 员 离开 (或 被 解雇 ) ， 不 能 再 
输入 这 个 代码 ， 程 序 就 开始 删除 文件 。 还 有 其 他 的 情况 ， 程 序 员 编制 程序 故意 改变 数据 或 者 
转移 资金 到 他 们 的 私人 账户 。 这 些 例子 展示 了 问题 的 核心 。 公 司 必须 信任 他 们 的 程序 员 ， 但 
是 这 种 信任 潜在 地 带 来 了 相当 多 的 危害 或 欺诈 。 这 也 是 公司 大 都 会 对 信息 管理 系统 的 雇员 做 
坏事 特别 敏感 的 原因 之 一 。 作 为 一 个 开发 者 ， 必 须 始终 看 到 一 个 信任 的 景象 。 


9.9.3 物理 安全 


在 物理 地 保护 计算 机 系统 这 个 问题 上 ， 最 重要 的 任务 就 是 确保 时 刻 都 有 一 个 当前 备份 。 这 
种 维护 备份 的 方针 同样 适用 于 硬件 。 万 一 失火 或 者 有 其 他 物理 灾难 ， 就 需要 收集 数据 磁带 ， 
然后 找 一 个 计算 机 来 加 载 和 运行 。 不 能 等 着 灾难 发 生 ， 你 确实 需要 创建 一 个 灾难 应 急 计 划 。 

灾难 应 急 计划 是 当 灾 难 发 生 时 信息 系统 部 门 能 执行 的 一 个 完整 的 计算 机 操作 步骤 的 序列 。 
灾难 计划 ， 描 述 了 什么 人 人 负责， 每 个 人 要 采取 的 步骤 ， 列 出 联系 号 码 ， 并 告知 如 何 让 系统 恢 
复 并 运行 起 来 。 找 到 一 台 替 代 计算 机 有 个 流行 的 方法 ， 就 是 租用 灾难 应 急 计 划 公 司 的 热 站 。 
热 站 包括 一 组 含有 动力 、 终 端 和 通信 系统 的 计算 机 工具 ， 还 有 一 个 计算 机 。 只 需要 每 月 付费 
即 可 在 灾难 发 生 时 有 权 使 用 这 些 工具 。 一 旦 灾难 发 生 ， 激 活 相 应 的 灾难 应 急 计划 ， 收 集 数 据 
磁带 ， 加 载 系 统 ， 装 载 你 的 备份 磁带 ， 并 从 热 站 运行 系统 。 一 个 稍 便宜 点 儿 的 选择 是 租用 冷 
站 。 冷 站 或 Shell site 和 热 站 类 似 ， 但 没有 计算 机 和 电信 通讯 设备 。 如 果 灾 难 发 生 ， 打 电话 给 你 
的 硬件 厂商 ， 再 买 一 台新 计算 机 。 事 实 上 ， 厂 商都 会 很 配合 的 。 关 键 在 于 接受 和 安装 新 计算 
机 可 能 需要 若干 天 ， 你 的 公司 这 些 天 没 计算 机 系统 能 存活 吗 ?如果 只 替换 较 少 的 计算 机 ， 一 
些 灾难 恢复 公司 可 以 开 着 卡车 ， 到 你 的 站 点 去 ， 在 你 的 停车 场 里 运行 系统 。 

在 保护 私人 电脑 时 一 个 更 有 趣 的 问题 出 现 了 。 首先 , 为 很 多 个 人 计算 机 备份 数据 更 加 困难 。 
如 果 他 们 连 着 网 络 ， 数 据 可 以 传送 到 中 央 文 件 服务 器 并 从 那里 复制 。 如 果 失 火 ， 至 少数 据 能 





恢复 。 可 是 ， 计 算 机 呢 ? 如 果 你 丢失 了 5 台 或 10 台 计算 机 ， 你 可 以 轻易 在 本 地 的 电脑 商城 买 来 
奉 代 单元 。 但 如 果 你 丢失 了 几 百 台 计 算 机 ， 替 代 它 们 可 就 








难 多 了 。 一 个 很 有 创意 的 方案 是 ， 帮 你 的 雇员 购买 他 们 在 “| 主人 

家 里 用 的 计算 机 。 如 果 发 生 问题 ， 在 你 重建 中 央 计 算 机 系 ”| .灾难 应 急 计 划 和 测试 

统 并 替换 那些 个 人 计算 机 时 ， 他 们 还 可 以 在 家 里 工作 。 .预防 
如 图 9-10 总 结 的 ， 预 防 是 提供 物理 安全 的 另 一 个 重要 地 点 

步骤 。 计 算 机 设施 应 该 有 火灾 监测 和 保护 系统 。 类 似 地 ， ph 

计算 机 设施 应 该 远离 易 发 洪水 的 平原 、 地 震 危 险 区 、 潮 汐 


地 区 和 其 他 易 发 生 灾难 的 区 域 。 同 时 应 该 限制 对 计算 机 、 图 9-10 物理 安全 控制 。 数 据 备份 是 


网 络 设备 和 私人 计算 机 的 物理 访问 。 绝 大 多 数 公 司 都 有 带 最 重要 的 步骤 。 找 一 个 移 人 

电子 锁 的 公司 机 构 证 章 。 还 需要 控制 访客 、 流 动人 员 和 临 应 全 计划 生生 下 拖 和 和 
四 vy 上 日 R 

时 雇员 的 访问 权 。 助 预防 问题 和 更 快 地 焦 复 

9.9.4 管理 控制 


由 于 数据 面临 的 威胁 主要 来 自 公 司 内 部 ， 所 以 传统 的 管理 控制 就 在 提升 安全 方面 起 到 了 重 
要 的 作用 。 例 如 ， 最 重要 的 控制 之 一 首先 就 从 雇佣 程序 开始 。 一 些 公司 会 对 雇员 做 背景 调查 
以 确定 其 性 格 和 可 信赖 程度 。 即 使 是 简单 的 推荐 验证 制度 都 可 以 使 问题 最 小 化 。 类 似 地 ， 公 
司 也 会 在 终止 雇佣 关系 上 更 加 谨慎 一 一 尤其 是 有 着 很 多 数据 库 访 问 权 的 管理 信息 系统 的 雇员 。 
即使 是 临时 解雇 ， 访 问 权 限 和 密码 也 会 立即 收回 。 

敏感 的 工作 都 是 分 段 的 。 比 如 说 ， 完 成 金融 事务 需要 若干 名 雇员 ， 和 更 多 金钱 有 关 的 事务 
会 分 配 到 更 高 级 别 的 雇员 身上 。 类 似 地 ， 对 外 机 构 如 银行 也 经 常 暂停 ， 由 高 级 主管 检验 大 型 
事务 。 事 务 通常 按时 间 、 地 点 和 执行 操作 的 人 来 进行 监控 和 记录 。 

在 某 些 情况 下 ， 可 以 通过 对 硬件 进行 物理 控制 来 提升 安全 性 。 计 算 机 集中 放 在 加 锁 的 和 有 
人 看 守 的 房子 里 。 雇 员 们 也 经 常 被 摄像 头 跟 踪 。 安 全 印章 也 常用 于 跟踪 雇员 访问 这 些 地 点 和 
计算 机 硬件 。 

咨询 机 构 和 商业 联盟 也 增加 了 与 安全 相关 的 问题 。 通 常 ， 对 于 选择 咨询 机 构 和 任意 合作 的 
雇员 都 较 少 有 控制 性 。 尽 管 你 可 以 在 选择 咨询 公司 时 加 以 控制 ， 但 对 于 分 配 到 你 处 的 特定 雇 
员 你 还 是 没 办 法 。 这 些 风 险 可 以 通过 限制 他 们 对 数据 和 物理 地 点 的 访问 权 来 控制 。 有 时 候 ， 
你 可 能 希望 给 每 个 顾问 都 配 一 个 内 部 雇员 。 


9.9.5 远 辑 安全 


逻辑 安全 的 本 质 就 是 你 想 让 每 个 用 户 都 能 从 某 种 程度 上 “| “未 授权 的 修改 
访问 数据 ， 却 可 以 精确 控制 用 户 拥有 的 访问 类 型 。 你 同样 希 | “未 授权 的 信息 截留 (拒绝 服务 ) 
望 监控 对 数据 的 访问 ， 用 以 发 现 潜在 的 问题 。 图 9-11 显 示 3 


“未 授权 的 泄漏 





图 9-11 逻辑 安全 性 问题 。 每 种 情 


种 你 想 要 避免 的 莹 本 问题 未 捞 权 的 港 汤 、 未 授权 的 修改 和 况 都 可 能 给 公司 带 来 麻烦 ， 
未 授权 的 信息 截留 (或 拒绝 服务 )。 包括 金融 损失、 时 间 浪 费 ， 
某 些 信息 是 需要 保护 的 ， 应 该 只 有 特定 组 的 用 户 才能 访 销售 减少 或 公司 解体 


问 到 。 例 如 ， 必 须 保 护 好 公司 的 战略 市 场 计 划 ， 以 防 竞争 者 们 得 到 这 些 数据 。 为 了 保证 安全 ， 
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只 有 公司 的 若干 核心 人 员 才能 访问 这 些 计划 。 

有 些 信息 可 以 显示 给 用 户 看 ， 不 过 却 不 应 该 被 用 户 更 改 。 例 如 ， 雇 员 应 该 能 够 查看 人 力 
资源 文档 来 验证 他 (或 她 ) 的 薪水 、 剩 余 假 日 或 价值 评估 。 但 是 ， 如 果 允 许 雇员 修改 这 些 数 
据 ， 势必 造成 错误 。 举 个 例子 ， 不 管 雇员 多 么 诚实 ， 允 许 他 们 修改 自己 的 薪水 都 是 一 个 危险 
的 诱惑 。 

第 三 个 问题 很 细微 但 同样 危险 。 考 虑 一 下 如 果 首席 金融 官 需要 获取 数据 来 定案 一 笔 银行 贷 
款 ， 而 安全 系统 设置 得 不 正确 ， 拒 绝 提供 这 些 需要 的 数据 会 出 现 什么 样 的 问题 。 如 果 数 据 没 
有 在 那天 结束 前 传送 到 银行 ， 就 会 耽误 公司 的 多 笔 支付 ， 受 到 消极 的 评价 ， 损 失 20% 的 股票 价 
格 ， 并 置 着 破产 的 危险 。 其 关键 就 是 ， 合 东 用 户 被 拒绝 提供 数据 可 能 和 把 权限 赋 错 了 人 同样 
危险 。 

假设 你 拥有 一 个 复杂 的 计算 机 系统 和 一 个 支持 安全 控制 的 DBMS ， 防 止 这 些 问题 只 需要 两 
步 。 首 先 ， 计 算 机 系统 必须 能 够 鉴别 每 个 用 户 。 其 次 ， 数 据 的 拥有 者 必须 对 每 块 数据 分 配合 
适 的 访问 权限 。DBA (或 安全 指挥 官 ) 有 责任 分 配 和 管理 用 户 账户 ， 从 而 惟一 地 识别 用 户 。 
应 用 设计 者 和 数据 拥有 者 联合 确定 必要 的 安全 控制 以 及 每 位 用 户 的 访问 权限 。 

用 户 鉴 别 

计算 机 多 辑 安全 的 主要 困难 之 一 就 是 鉴别 用 户 。 人 类 识别 其 他 人 是 运用 建立 在 外 吻 、 声 音 、 
笔迹 等 之 上 的 复杂 的 模式 识别 技巧 。 然 而 即使 是 人 也 可 能 被 蒙骗 。 计 算 机 在 模式 识别 方面 很 
脆弱 ， 所 以 还 需要 其 他 技术 。 

鉴别 用 户 最 常用 的 方法 就 是 通过 用 户 名 和 密码 。 每 个 人 都 有 一 个 独立 的 账户 名 并 选择 一 个 
密码 。 理 论 上 ， 只 有 个 人 用 户 和 计算 机 系统 知道 这 个 密码 。 当 用 户 输入 正确 的 名 字 和 对 应 的 
密码 后 ， 计 算 机 就 接受 认证 这 个 人 。 

问题 是 ， 计 算 机 在 记忆 密码 方面 比 人 强 得 多 。 因 此 ， 人 们 常 选择 费解 的 密码 。 一 些 创建 窗 
码 的 基本 规则 在 图 9-12 列 出 。 最 好 的 密码 都 较 长 ， 包 一 -一 一 
含 非 字母 字符 ， 和 用 户 没有 关系 ， 并 且 常 常 改变 。 | 不 要 信用 个 天 丈 人 的 么 字 
这 样 很 好 ， 但 当今 用 户 可 能 轻易 就 需要 10 个 、20 个 | .包含 非 字 母 的 字符 
甚至 更 多 个 不 同 的 账户 和 密码 。 几 乎 没 人 能 记 住 安 | 。 至 少 使 用 6 个 字符 





全 所 需 的 每 个 账户 和 费解 的 密码 。 所 以 很 自然 的 一 “| “ 经， 改变 丰 

个 倾向 就 是 ， 或 者 把 密码 写 到 基 个 方便 的 地 方 《 这 图 9-12 密码 建议 。 挑 选 不 在 字典 里 并 且 很 
样 可 能 被 其 他 人 发 现 )， 或 者 选择 简单 的 密码 (这样 难 冰 的 密码 。 关 键 是 ， 你 是 否 能 记 
可 能 被 猜 出 )。 住 复杂 的 密码 ? 


目前 密码 是 最 容易 实现 的 系统 。 已 经 有 一 些 在 中 央 安 全 服务 器 存储 密码 的 工作 了 (例如 
Kerberos) ， 就 是 用 户 登录 主 服务 器 ， 然 后 所 有 其 他 软件 都 利用 服务 器 验证 用 户 。 男 一 种 方法 
是 使 用 密码 生成 卡片 。 每 个 用 户 带 一 个 每 分 钟 都 能 生成 新 密码 的 小 卡片 。 登 录 时 ， 计 算 机 产 
生 一 个 和 那 张 卡片 同步 的 密码 。 一 旦 密码 使 用 过 后 ， 就 立即 失效 ， 所 以 即使 人 侵 者 看 到 密码 ， 
也 没有 任何 价值 。 该 系统 仍然 需要 用 户 记 住 一 个 短 密码 以 防 密码 卡 被 贼 偷 去 。 当 然 ， 如 果 用 
户 丢 失 了 密码 卡 ， 也 就 无 法 访问 这 人 台 计 算 机 了 。 加 密 的 软件 变种 可 以 装载 到 笔记 本 电脑 ， 然 
后 提供 对 共有 网 络 的 访问 。 

其 他 方案 都 正在 开发 中 ， 目 的 是 抛弃 记忆 密码 的 需要 。 靠 度量 物理 特性 的 生理 测定 系统 已 
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经 存在 并 越 来 越 廉价 。 例 如 ， 指 纹 、 手 印 、 虹 膜 、 声 音 鉴 别 以 及 热力 图 像 系统 都 工作 得 很 好 。 
生理 测定 方法 的 优点 是 用 户 不 需要 记忆 任何 东西 ， 也 不 需要 带 任何 可 能 丢失 或 被 盗 的 设备 。 
主要 的 缺点 还 是 成 本 ， 因 为 验证 设备 必须 安装 到 任何 雇员 可 能 访问 计算 机 的 地 方 。 一 个 次 要 
问题 是 尽管 这 些 设备 在 阻止 未 授权 访问 方面 表现 良好 ， 但 仍 有 很 多 保持 了 较 高 的 失败 率 ， 拒 
绝 合法 用 户 的 访问 。 

个 人 用 户 被 鉴别 后 ， 大 多 数 系统 允许 把 个 人 分 配 到 组 。 组 使 得 分 派 用 户 权 限 更 加 容易 些 。 
例如 ， 通 过 把 100 个 雇员 放 到 文书 组 ， 就 可 以 赋予 组 权限 ， 这 样 比分 派 100 次 相同 权限 要 快 得 多 。 

访问 控制 

用 户 被 鉴别 以 后 ， 就 可 以 赋予 他 们 对 任何 资源 的 特定 许可 。 从 数据 库 的 角度 看 ， 必 须 设 定 
两 个 级 别 的 访问 。 首 先 ， 必 须 利用 操作 系统 命令 ， 赋 了 予 用 户 对 整个 数据 库 的 访问 权限 。 其 次 ， 
利用 数据 库 安 全 命令 ， 赋 予 用 户 具体 的 许可 。 

要 记得 DBMS 也 只 是 运行 在 计算 机 环境 的 另 一 个 软件 。 它 利用 受 操作 系统 控制 和 监视 的 文 
件 来 存储 数据 。 在 任何 人 访问 到 DBMS 控 制 的 数据 前 ， 需 要 计算 机 赋予 这 个 人 访问 整个 数据 库 
目录 和 对 应 文件 的 许可 。 这 种 情况 也 要 求 用 户 被 两 次 鉴别 : 一 次 被 操作 系统 ， 一 次 被 DBMS。 
在 某 些 系统 上 (比如 Windows 2000)，DBMS 可 能 会 直接 接受 操作 系统 的 用 户 标 识 。 在 没有 安 
全 设施 的 操作 系统 上 (如 基于 个 人 计算 机 的 Windows)，DBMS 人 负责 提 供 所 有 的 安全 性 。 即 使 有 
高 级 的 数据 库 系 统 ， 也 可 能 需要 为 某 些 应 用 而 在 DBMS 内 部 创建 用 户 账户 。 比 如 说 ， 基 于 Web 
的 应 用 一 般 会 避免 使 用 操作 系统 的 登录 机 制 ， 并 且 更 为 简单 地 在 数据 库 内 部 注册 用 户 和 密码 。 

操作 系统 的 许可 包括 在 目录 级 别 ( 读 取 、 查 看 、 写 人 、 创 建 和 删除 ) 的 许可 。 类 似 的 许可 
同样 适用 于 独立 的 文件 〈 读 取 、 写 和信、 编辑 和 删除 ) 。 在 大 型 系统 中 DBMS 以 独立 的 用 户 登 录 。 
DBA 保 证 了 这 个 DBMS 用 户 对 他 (或 她 ) 自己 的 文件 拥有 完全 的 目录 、 文 件 控制 权 。 如 果 你 
使 用 的 是 网 络 上 一 台 基 于 个 人 计算 机 的 系统 ， 必 须 通过 网 络 操作 系统 来 赋予 用 户 对 你 自己 文 
件 的 访问 权 。 例 如 ， 用 户 需 要 对 你 存放 文件 的 目录 拥有 读 权 限 ， 同 时 应 该 给 他 们 在 特别 文件 
和 加 锁 文件 的 读 写 权 限 ， 但 是 ， 要 避免 给 他 们 对 任何 文件 的 删除 权 。 一 个 拥有 删除 权限 的 用 
户 若 心怀 不 满 ， 就 可 能 删除 你 整个 数据 库 一 一 即使 他 (或 她 ) 没 法 改变 这 些 特定 的 设置 。 当 然 ， 
你 有 备份 ， 但 是 找到 问题 并 且 重 新 加 载 数据 库 对 用 户 来 说 是 非常 烦人 的 。 

当 操 作 系 统 用 户 对 所 有 的 文件 都 有 权 访 问 时 ， 可 
以 使 用 DBMS 的 安全 系统 来 控制 对 单个 表 的 访问 。 大 
多 数 情况 下 ，DBA 必 然 会 在 DBMS 内 部 创建 用 户 账户 
来 鉴别 每 位 用 户 。 在 某 些 环境 下 ， 这 种 技术 意味 着 用 
户 得 登录 两 次 : 一 次 到 操作 系统 ， 一 次 到 数据 库 。 所 
有 的 数据 库 系 统 都 有 一 个 DBA 用 的 安全 工具 ， 来 帮助 
添加 删除 用 户 和 更 改 密码 。 

图 9-13 列 出 的 特权 可 以 应 用 于 整个 表 或 者 查询 。 





图 9-13 DBMS 特 权 。 这 些 特权 适用 于 整 


绝 大 多 数 你 能 得 到 的 特权 就 是 读 、 修 改 和 插入 。 删 除 个 表 或 查询 ”前 三 个 〈 读 、 更 新 
许可 意味 着 用 户 可 以 删除 整 行 ， 它 只 应 该 在 特殊 情况 和 插入 ) 最 为 常用 。 设 计 特 权 通 
下 赋予 少数 人 。 更 强大 的 特权 可 以 让 用 户 读 取 和 修改 常 仅仅 赋予 开发 者 


表 、 表 单 、 报 表 的 设计 。 这 些 特权 只 应 该 留 给 那些 可 信 的 用 户 。 用 户 几 乎 不 会 想 修改 原本 的 
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表 的 设计 ， 这 些 特 权 是 给 开发 者 的 。 

在 大 多 数 数据 库 系统 里 ， 基 本 的 安全 许可 都 可 以 通过 两 条 SQL 命 令 设置 GRANT 和 
REVOKE。 图 9-14 表 示 GRANT 命 令 的 标准 语法 。REVOKE 命 令 类 似 。SQL 92 通 过 允许 在 
GRANT 和 REVOKE 命 令 中 指定 列 ， 提 供 了 一 些 额 外 





的 安全 控制 ， 所 以 现在 可 以 仅仅 对 一 个 或 两 个 列 分 配 ee 

权限 。 不 过 ， 这 种 特权 会 应 用 于 表 和 查询 的 每 一 行 。 i 
大 多 数 的 数据 库 系 统 提供 可 视 化 的 安全 工具 来 帮 ee 

助 分 配 访问 权限 。 当 执行 同时 给 大 量 报表 或 者 很 多 用 ON objects 

户 分 配 权限 这 种 批 操作 时 ，SQL 命 令 很 有 用 。 可 视 化 FROM users 

工具 在 单一 操作 中 更 加 好 用 。 同 时 ， 你 可 以 轻易 地 看 图 9.14 SQL 安全 命令 大 多 数 系统 同时 

到 很 多 用 户 当前 已 经 分 配 的 许可 。 提供 一 个 可 视 化 工具 来 赋予 和 回 
GRANT 命令 还 提供 一 个 有 时 有 用 的 额外 选项 。 收 访问 权限 


作为 数据 库 元素 的 所 有 者 ， 当 你 准予 时 你 可 以 传播 你 的 权力 。 如 果 添 加 WITH GRANT OPTION 
字句 ， 那 么 任何 你 指定 接收 这 些 权限 的 人 都 可 以 再 把 这 些 权限 传递 给 其 他 人 。 例 如 ， 你 可 以 
准许 WITH GRANT OPTION 市 场 部 门 的 头目 拥有 一 个 表 的 SELECT ( 读 ) 权限 。 那 么 ， 这 个 
人 就 可 以 再 把 读 权限 赋予 市 场 部 的 其 他 人 了 。 

数据 库 角 色 

想象 一 下 如 果 你 必须 给 成 千 上 万 个 雇员 分 配 许 可 ， 你 将 面临 多 大 的 管理 难题 ? 每 次 有 雇员 到 
来 或 离开 ， 就 得 有 人 分 配 或 去 除 可 能 与 数 百 张 表 或 视图 有 关 的 权限 。 这 项 任务 很 耗 时 间 而 且 非 常 
容易 出 错 。 即 使 你 建立 SQL 过 程 来 帮忙 ， 也 几乎 需要 时 时 去 维护 。 一 个 相对 特别 简单 有 效 的 解决 
方案 就 是 定义 数据 库 角 色 。 角 色 常 常 和 一 组 用 户 相关 ， 并 且 包 含 着 一 些 同 时 分 配 的 权限 。 如 图 
9-15 所 示 ， 你 创建 一 个 角色 ， 并 且 把 需要 的 许可 分 配给 角色 ， 而 不 是 分 配给 个 人 用 户 。 然 后 再 把 
角色 分 配给 特定 用 户 。 当 有 新 的 雇员 到 来 时 ， 把 角色 添加 给 用 户 就 提供 了 所 有 必要 的 许可 。SQL 
99 标 准 有 把 角色 分 配给 其 他 角色 的 功能 。 例 如 ， 你 可 以 定义 一 些 较 小 的 任务 集合 当 作 角色 (销售 
条 目 、 添 加 客户 、 更 新 库存 ) ， 然 后 把 这 些 任务 分 配给 更 大 的 角色 (售货员 、 库 存 管理 员 等 )。 











条 目 :SELECT 





消费 者 ”SELECT, 
UPDATE 


销售 SELECT, 
UPDATE, INSERT 


给 角色 分 配 许可 


新 雇员 : 添加 角 
色 到 个 人 


图 9-15 数据 库 角色 。 创 建 一 个 角色 并 给 角色 分 配 许可 。 添 加 或 删除 雇员 时 ， 
只 需 简单 地 分 配 或 移 除 需要 的 角色 就 可 以 立即 提供 适当 的 许可 
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作为 控制 的 查询 

在 很 多 系统 里 ， 基 本 的 安全 命令 很 强大 ， 但 在 有 用 性 方面 稍微 有 些 局 限 。 很 多 系统 仅仅 能 
对 整个 表 或 查询 分 发 和 收回 权限 。 数 据 库 安全 系统 真正 强大 的 地 方 在 于 它 允 许 把 权限 分 配 到 
独立 的 查询 上 。 看 看 图 9-16 的 例子 。 有 一 个 Employee (雇员 ) 表 列 出 了 每 个 工人 的 姓名 、 电 
话 号 码 和 薪水 。 想 把 这 个 表 当 作 电 话 本 使 用 ， 这 样 雇 员 们 就 可 以 查询 其 他 工人 的 电话 了 。 可 
问题 是 ， 不 想 让 雇员 们 看 到 薪水 值 。 解 决 方法 就 是 创建 一 个 仅 包含 姓名 和 电话 号 码 的 查询 。 
要 记得 查询 并 不 复制 数据 ， 只 是 简单 地 从 其 他 表 中 提取 数据 。 现 在 ， 把 Phonebook 查 询 的 
SELECT 特权 分 配给 所 有 和 雇员， 并 回收 所 有 雇员 在 原始 的 Employee 表 上 的 特权 。 如 果 你 愿意 ， 
还 可 以 从 Employee 表 中 选择 特定 的 行 。 比 如 ， 你 可 能 不 想 让 高 级 主管 们 的 电话 号 码 显示 出 来 。 

第 4 章 和 第 5 章 展示 了 查询 的 强大 。 利 用 这 种 强大 的 功能 可 以 建立 事实 上 你 需要 的 任何 级 
别 的 安全 。 实 际 上 ， 任 何 用 户 对 数据 库 的 存 取 权 限 都 是 通过 查询 来 实现 的 。 避 免 任 何 直接 针 
对 表 的 权限 分 配 。 那 么 ， 随 着 商业 需求 的 改变 而 修改 安全 条 件 就 容易 多 了 。 

基本 的 过 程 就 是 与 用 户 协商 ， 并 准确 地 了 解 每 个 用 户 访问 数据 时 都 需要 哪 种 类 型 的 权限 。 
特别 地 ， 确 定 哪 些 用 户 有 增加 或 改变 数据 的 需求 。 然 后 创建 用 户 并 给 查询 分 配合 适 的 安全 条 
件 。 一 定 要 对 每 个 用 户 组 进行 应 用 的 测试 。 如 果 安 全 问题 很 重要 ， 可 以 考虑 安排 一 些 程序 员 
以 不 同 用 户 的 角度 去 “攻击 ”数据 库 ， 检 查 他们 是 不 是 能 够 删除 或 者 改变 重要 文件 。 


Employee(ID，Name， Phone, Salary) 


Query: Phonebook 
SELECT Name, Phone 
FROM Employee 





图 9-16 使 用 查询 的 安全 性 。 你 想 所 有 的 雇员 都 能 够 查询 工人 的 电话 号 码 ， 但 
不 想 让 他 们 看 到 薪水 值 。 定 义 一 个 只 包含 所 需 数据 的 查询 ， 然 后 把 对 
这 个 查询 (而 不 是 原始 表 ) 的 权限 分 配给 用 户 


9.9.6 职责 分 市 


若干 年 来 ， 安 全 专家 们 都 在 担心 公司 的 工作 人 员 进 行 偷窃 或 欺诈 。 考 虑 一 个 似乎 年 年 都 会 
出 现 的 典型 情况 。 一 个 采购 经 理 创建 了 一 个 假 的 供应 商 。 假 装 公司 有 货 到 并 批准 了 付款 。 当 
然 ， 这 个 经 理 自己 兑现 了 付款 支票 。 这 样 的 一 些 欺诈 在 罪犯 被 抓 住 前 可 能 会 实施 很 多 年 。 

避免 这 种 问题 的 标准 做 法 就 是 分 清 所 有 职员 的 职责 。 目 标 是 保证 在 所 有 主要 的 金融 事务 中 
都 至 少 涉及 2 个 人 。 举 个 例子 ， 一 个 采购 经 理 可 以 找到 新 的 供应 商 ， 或 许 兼 发 出 采购 请 求 。 另 
一 个 人 将 负责 接收 请 求 ， 然 后 第 3 个 人 批准 付款 。 

划分 职责 的 目标 要 实现 起 来 还 是 很 有 挑战 性 的 。 公 司 会 试图 利用 裁员 来 降低 成 本 。 生 意 起 
色 了 ， 一些 人 就 会 利用 这 种 混乱 。 消 除 所 有 的 欺诈 是 不 可 能 的 。 但 是 ， 设 计 完 好 的 数据 库 应 
用 还 是 能 够 提供 一 些 有 用 的 控制 的 。 

考虑 图 9-17 里 面 的 采购 实例 ， 其 基本 表 包 含 了 Supplier (供应 商 ) 表 、SupplyItem ( 供 货 
条 目 ) 表 、PurchaseOrder (采购 订单 ) 表 和 PurchaseItem (采购 条 目 ) 表 。 男 外 ， 财 务 表 批准 
和 记录 付款 。 职 责 分 割 的 关键 就 是 正确 地 给 每 个 表 分 配 权限 。 采 购 经 理 是 惟一 有 权 在 Supplier 
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表 上 添加 新 行 的 用 户 。 采购 员 是 惟一 有 权 在 PurchaseOrder 表 和 purchaseItem 表 添加 新 行 的 用 户 。 

接收 员 是 惟一 有 权 记 录 供 应 品 收据 的 用 户 。 现 在 ， 如 果 一 个 采购 员 想 创建 假 的 订单 ， 他 (或 

她 ) 将 不 能 创建 新 的 供应 商 。 因 为 Order 表 和 Supplier 表 之 间 有 强制 的 参照 完整 性 约束 ， 这 个 职 

员 甚 至 不 能 在 订单 的 表单 里 输入 一 个 假 的 供应 商 。 同 样 ， 付 款 只 会 被 送 到 合法 的 公司 ， 并 且 

采购 经 理 也 没 法 假 造 到 货 的 收据 。 数 据 库 安全 系统 的 强大 就 在 于 它 总 是 强制 执行 分 配 的 责任 。 
Supplier 









采购 经 理 可 以 添加 
新 的 供应 商 ， 但 不 
能 添加 新 的 订单 













Purchasing 
Manager Clerk 


Select, Insert, 
PurchaseOrder table Select Select, Insert, 
Purchaseltem table Modify, Delete 








职员 必须 使 用 Supplier 
表 中 的 SupplierID ， 并 
且 不 能 添加 新 的 供应 商 





图 9-17 职责 分 割 。 职 员 不 能 创建 假 的 供应 商 。 参 照 完 整 性 强迫 职员 输入 
Supplier 表 中 的 SupplierID ， 并 且 不 能 在 Supplier 表 中 添加 新 的 行 


9.9.7 软件 升级 


当代 的 软件 都 庞大 且 复 杂 。 软 件 厂 商 和 其 他 研究 人 员 常 常 在 软件 发 行 后 发 现 安全 问题 。 一 
般 ， 公 司 会 有 一 个 评估 安全 威胁 、 打 补丁 修补 问题 并 通知 用 户 升级 系统 的 过 程 。 困 难 的 是 ， 
对 用 户 宣告 安全 瑕 病 也 意味 着 潜在 的 黑客 被 这 个 问题 所 提醒 。 只 要 所 有 的 用 户 能 立即 给 系统 
打上 补丁 ， 这 样 的 宣告 就 很 有 效 。 但 是 ， 作 为 一 个 数据 库 管理 员 ， 问 题 并 不 如 此 简单 。 即 使 
你 收 到 一 个 通知 ， 你 仍然 需要 测试 这 个 补丁 并 确保 它 在 你 的 应 用 里 不 出 问题 。 这 时 ， 黑 客 们 
就 借助 已 知 的 安全 漏洞 ， 对 没 打 补丁 的 公司 系统 发 起 了 攻击 。 

因此 ， 数 据 库 管理 员 的 一 项 主要 任务 就 是 关注 DBMS 和 操作 系统 软件 的 安全 版 本 发 行 。 这 
些 补丁 需要 在 测试 机 器 上 安装 ， 并 尽快 转移 到 实际 系统 中 。 同 时 ， 网 络 管理 员 可 以 屏蔽 特定 
的 端口 ， 防 止 外 人 访问 数据 库 。DBA 和 网 络 管理 员 还 必须 细心 地 监控 网 络 和 服务 器 ， 查 看 是 
否 有 无 赖 进程 的 启动 。 
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9.10 加 密 


加 密 是 根据 一 些 码 来 修改 原始 信息 的 一 种 方法 ， 这 样 只 有 用 户 知道 解码 才 可 以 读 出 信息 。 
加 密 可 以 用 来 从 一 台 计 算 机 向 另 一 人 台 计 算 机 传输 信息 。 存 在 一 台 计 算 机 上 的 数据 也 可 以 加 密 。 
没有 解密 密 钥 ， 文 件 就 是 乱码 。 加 密 对 那些 不 提供 用 户 鉴 别 和 权限 控制 的 基于 个 人 计算 机 的 
系统 来 说 非常 关键 。 加 密 在 通过 网 络 (尤其 是 因特网 ) 传输 数据 时 也 非常 重要 。 

当今 流行 两 种 基本 的 加 密 方式 。 大 部 分 方式 都 使 用 同一 个 密 钥 来 加 密 和 解密 消息 。 例 如 ， 
高 级 加 密 系统 (AES) 就 使 用 单独 一 个 密 钥 。 尽 管 AES 是 美国 标准 ， 但 它 的 版 本 遍及 全 球 ， 
为 它 是 基于 两 个 比利时 译 码 者 创建 的 Rijndael 的 。AES 算 法 速度 很 快 ; 并 支持 128、192 和 256 
位 的 密 钥 长 度 ， 有 效 防止 试验 所 有 可 能 密 钥 值 的 穷 举 攻 去 。 要 注意 ， 给 密 钥 加 一 位 就 会 产生 
了 两 倍数 目的 密 钥 ， 例 如 ， 使 用 当代 的 计算 机 ， 从 56 到 128 位 就 得 多 测试 2 种 可 能 。 图 9-18 展 
示 了 AES 加 密 方法 的 基本 应 用 。 





图 9-18 单一 密 钥 加 密 。 加 密 和 解密 消息 使 用 同一 个 密 钥 。 当 涉及 很 多 用 户 时 ， 
分 发 和 控制 密 钥 的 访问 权限 就 成 了 主要 问题 


AES 的 主要 缺点 是 需要 双方 有 同一 个 加 密 密 钥 。 另 一 种 方法 同时 使 用 一 个 私有 密 钥 ( 私 钥 ) 
和 公有 密 钥 (分 钥 ) 。 不 管用 哪个 密 钥 加 密 消 息 ， 用 另 一 个 才能 解 开 。RSA (Rivest-Shamir- 
Adelman) 算法 就 是 使 用 双 密 钥 方法 的 一 个 实例 。RSA 在 多 种 计算 机 上 都 具有 保护 作用 。RSA 
加 密 的 实施 源 于 素数 的 性 质 。 具 体 讲 ， 就 是 把 两 个 素数 相 乘 相对 很 容易 ， 但 再 把 那个 很 大 的 
结果 分 解 回 两 个 素数 ， 就 极其 困难 。RSA 方 法 的 安全 性 依赖 于 使 用 超大 数字 (128 位 或 更 多 )， 
这 样 用 当前 技术 分 解 的 话 就 需要 很 多 年 。 : 

使 用 双 密 外 的 方法 有 很 多 有 趣 的 应 用 。 其 诀窍 是 : 人 人 都 知道 你 的 公有 密 钥 ， 但 只 有 你 知 
道 私 有 密 钥 。 考 虑 如 下 情形 ，Bob 想 通过 因特网 给 Alice 发 送 一 个 数据 库 事 务 。Bob 在 字典 里 查 
到 了 Alice 的 公 钥 。 一 旦 消息 用 Alice 的 公 钥 加 密 ， 就 只 有 她 的 私 钥 才 能 解 开 : 没有 其 他 人 可 以 
读 取 或 者 改变 这 条 事务 消息 。 但 是 ， 消 息 可 能 在 Alice 读 到 之 前 就 被 人 破坏 。 

双 密 钥 系 统 还 有 另 一 种 称 为 认证 的 应 用 。 我 们 还 是 认为 Bob 想 给 Alice 发 送 消 息 。 为 了 确保 
只 有 她 能 够 读 取 ， 他 用 她 的 公 钥 加 密 了 数据 。 但 是 ，Bob 担 心 有 人 冒充 他 的 名 字 给 Alice 发 送 虚 
假 消息 ， 他 想 保证 Alice 能 知道 消息 确实 来 自 他 本 人 。 如 果 Bob 同 时 用 他 的 私 钥 加 密 消息 ， 消 息 
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就 只 能 被 Bob 的 公 钥 解 开 。 当 Alice 接 到 消息 后 ， 用 她 的 私 钥 和 Bob 的 公 钥 来 解密 。 如 果 消息 可 
读 ， 就 肯定 是 Bob 发 的 。 这 种 情形 在 图 9-19 中 展示 。 


传输 Ea 













Alice 


| 使 用 Alice 
| 使 用 Bob 的 
私有 密 钥 


使 用 Bob 的 | ”| 使 用 Alice 
公有 密 钥 的 公有 密 钥 
图 9-19 双 密 钥 加 密 。Bob 给 Alice 发 送 消 息 。 先 通过 自己 的 私有 密 钥 ，Bob 对 消 
息 进行 认证 。 然 后 通过 使 用 Alice 的 公有 密 钥 加 密 ， 就 只 有 Alice 能 读 取 
消息 

当代 的 加 密 模 式 都 有 强大 的 工具 支持 。 可 以 使 用 它们 自动 地 保证 数据 的 安全 存储 和 传 
输 一 一 即使 在 因特网 这 样 的 开放 网 络 中 。 要 牢记 : 所 有 的 加 密 模式 都 会 受到 穷 举 攻 击 的 威胁 。 
随 着 计算 机 越 来 越 快 ， 旧 的 加 密 模式 会 更 具 风 险 。 

双 密 钥 加 密 系统 在 信息 通信 的 所 有 方面 都 非常 有 用 。 但 确实 有 一 个 复杂 的 问题 : 列 出 所 有 
公有 密 钥 的 字典 必须 准确 。 想 想 如 果 有 人 假扮 了 Bob 并 自己 创建 了 一 对 私有 和 公有 密 钥 时 会 发 
生 什 么 。 这 个 攻击 者 将 在 任何 事务 被 看 作 是 Bob。 因 此 ， 公 有 密 钥 必须 由 一 个 可 信 组 织 来 维护 。 
而 且 ， 这 个 企业 必须 仔细 地 检验 任何 申请 密 钥 的 人 (个 人 和 集团 ) 的 身份 。 一 些 公司 已 经 开 
始 提供 这 种 称 作 认证 中 心 的 服务 了 。YVerisign 就 是 其 中 一 个 带头 的 商业 公司 。 

作为 内 部 应 用 ， 可 以 相对 容易 建立 一 个 公司 服务 器 作为 认证 中 心 。 通 过 这 种 方法 ， 可 以 获 
.得 内 部 的 安全 认证 ， 保 护 雇员 之 间 的 传输 和 内 部 数据 库 应 用 。 这 种 方法 比 为 每 个 雇员 购买 一 
个 年 度 的 认证 要 便宜 。 当 然 ， 你 的 认证 很 可 能 不 被 公司 之 外 的 人 接受 ， 所 以 你 仍然 需要 为 那 
些 和 外 面 公 司 、 个 人 打交道 的 应 用 购买 商业 认证 。 


“管理 
9.11_ Sally 的 宠物 商店 sh 
。 全 体 销售 
为 Sally 的 党 物 商 店 分 配 安全 许可 的 第 一 步 是 区 分 不 同 的 用 户 证 二 5 
组 。 图 9-20 展 示 了 初始 列表 。 随 着 公司 的 成 长 ， 最 终 还 会 有 其 他 类 销售 人 员 
别 的 用 户 。 注 意 这 些 都 是 组 ， 而 且 每 种 类 别 都 会 有 人 被 分 配 进来 。 人 
第 二 步 是 确定 不 同 用 户 将 要 执行 的 操作 。 设 计 单 独 的 表单 支 pe 
持 每 一 种 活动 。 图 9-21 包 含 了 一 个 主要 活动 列表 的 部 分 内 容 。 ea 
需要 在 操作 系统 和 DBMS 里 创建 用 户 和 组 的 账户 。 创 建 了 表 、 客户 





查询 和 表单 后 ，DBA 应 该 确保 只 有 DBA 才 能 够 读 取 和 修改 数据 。 ”图 9-20 sally 的 宠物 商店 里 
现在 检查 一 下 每 种 操作 并 确定 执行 操作 所 需要 的 查询 和 表 。 用 户 组 的 初始 列表 
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应 该 对 每 个 需要 完成 操作 的 用 户 组 列 出 许可 。 。 产品 
9-22 展 示 了 从 供应 商 订购 项 目 可 能 需要 的 许可 。 广 销售 
意 ， 只 有 商店 经 理 (和 老板 ) 可 以 定购 新 的 货物 购买 

( 即 MerchandiseOrder 和 Orderltem 表 的 添加 权限 )。 _ 接收 货物 
同样 ， 只 有 老板 可 以 添加 新 的 供应 商 。 要 记得 有 和 
一 个 参照 完整 性 约束 ， 强 近 MerchandiseOrder 表 只 购买 
使 用 Supplier 表 中 出 现 的 供应 商 。 因 此 ， 商 店 经 理 动物 健康 保护 
将 不 能 捏造 出 一 个 假 的 供应 商 。 同 时 ， 你 可 能 "雇员 

望 商店 经 理 在 Orderftem 表 中 添加 条 目 ， 但 不 让 他 本 
们 修改 已 经 完成 的 订单 。DBMS 可 能 不 支持 这 种 约 薪水 
东 ， 并且 你 很 可 能 已 经 赋予 了 经 理 写 入 的 权限 。 。 账目 
如 果 这 样 ， 这 种 差别 就 会 很 有 用 。 否 则 ， 掌 管 接 支付 

收 产 品 的 经 理 就 可 能 窃取 一 些 条 目 并 更 改 原始 的 从 证 报 


订单 数量 。 如 果 Sally 有 足够 多 的 经 理 ， 这 个 问题 
就 可 以 通过 分 割 职责 来 最 小 化 ， 就 是 让 一 个 经 理 ” 图 9-21 Sally 宠 物 商 店 里 的 主要 操作 。 所 有 这 














发 出 订单 而 另 一 个 经 理 记录 接收 到 货 。 些 事 务 都 在 数据 库 里 建立 表单 或 报表 
| 
ne | van | a sl | 

So Wa WA Row [WA [wa | 
BE WA ne RA 
EE 

EE 

i 

一 | 一 一 








* 基本 的 供应 商 数据 : ID、 名称、 地址、 电话 、 区 域 码 、 城 市 ID 
R= 读 取 ，W = 写 入 A= 添加 


图 9-22 关于 订购 的 许可 。 只 有 老板 可 以 添加 新 的 供应 商 ， 并 且 只 有 最 高 级 别 
的 经 理 可 以 创建 新 的 订单 
同样 要 注意 Sally 想 记录 发 出 订单 的 雇员 身份 。 为 达到 这 个 目的 ， 需 要 EmployeeID 和 Name 
列 的 读 取 许 可 。 这 种 特权 可 以 通过 创建 一 个 独立 的 只 从 Employee 表 中 提取 最 少 列 的 
EmployeeName 查 询 来 建立 。 然 后 为 订购 ， 可 以 使 用 这 个 查询 代替 原始 的 Employee 表 。 


小 结 


管理 一 个 数据 库 涉 及 到 若干 步 又 。DA 执 行 与 设计 、 规 划 相 关 的 管理 任务 。 其 中 建立 利于 
共享 数据 和 集成 应 用 的 标准 有 着 较 高 的 优先 级 。DA 同 时 与 用 户 和 商务 经 理 一 起 工作 ， 发 现 新 
的 应 用 。 相 对 地 ，DBA 负 责 安装 和 维护 DBMS 软 件 ， 定 义 数据 库 ， 确 保 数 据 备 份 ， 鉴 控 性 能 ， 
并 且 帮 助 开 发 者 。 


第 9 羡 ”数据 摩 党 理 与 安全 297 


应 用 开发 的 每 一 步 都 涉及 数据 管理 的 不 同方 面 。 规 划 时 必 须 估计 规模 和 大 致 的 开发 成 本 。 
设计 阶段 会 用 到 项 目 管理 技巧 和 团队 思想 来 分 隔 项 目 ， 并 分 配给 个 人 。 实 现 则 需要 建立 和 加 
强 开发 标准 ， 测 斌 过程 ， 培 训 以 及 操作 计划 。 一 旦 应 用 运行 起 来 ，DBA 在 空 间 和 处 理 时 间 两 
方面 监控 性 能 。 还 需要 调整 物理 存储 参数 和 其 他 一 些 属性 ， 以 提高 应 用 性 能 。 

备份 和 恢复 是 日 常 中 必须 执行 的 关键 管理 任务 。 备 份 在 那些 需要 持续 运行 的 系统 上 更 具 挑 
战 性 。DBMS 在 某 个 时 间 点 取 一 个 快照 并 保存 数据 。 所 有 的 改变 都 存在 流水 日 志 里 ， 这 个 日 志 
也 会 定期 备份 。 如 果 需 要 恢复 系统 ，DBMS 就 导入 快照 ， 并 把 记录 下 的 变化 集成 进去 。 

安全 在 数据 库 管 理 中 是 个 重要 问题 。 物 理 安全 包括 涉及 到 具体 设备 的 问题 ， 比 如 自然 灾害 
或 硬件 的 物理 失窃 。 数 据 备份 和 灾难 计划 都 是 提供 物理 安全 的 关键 。 逻 辑 安 全 包括 保护 数据 
以 免 发 生 未 授权 的 泄漏 、 未 授权 的 修改 和 未 授权 的 信息 截留 。 提 供 逻 辑 安全 的 第 一 步 是 创建 
能 使 计算 机 识别 用 户 身份 的 系统 。 然 后 应 用 设计 者 和 用 户 必须 确定 每 个 用 户 所 应 该 得 到 的 访 
问 权限 。 分 配 访问 权限 ， 强 制 进行 职责 分 隔 。 

数据 库 常常 需要 利用 加 密 工具 进行 保护 。 当 操作 系统 没 法 保护 数据 库 文件 时 ， 加 密 就 显得 
格外 重要 。 如 果 数 据 必须 通过 网 络 (尤其 是 像 因 特 网 那样 的 开放 型 网 络 ) 传输 时 ， 加 密 也 比 
较 有 用 。 


二 
Miranda 很 忆 训 会 发 现 DBA 的 作 务 和 开发 者 并 不 相同 ， 但 是 开发 者 一 定 要 与 DBA 紧 密 
开发 者 ， 必 须 理 解数 据 标准 的 重要 性 。 也 需要 在 计划 、 实 现 和 维护 数据 


。 详 应 用 方面 同 DBA 合 作 。 在 应 用 实现 以 前 ， 需 要 建立 数据 库 安 全 权限 和 控制 。 对 于 项 目 
而 言 ， 标 识 所 有 用 户 并 确定 他 们 的 访问 权限 。 使 用 查询 只 赋 给 他 们 对 所 需 数 据 的 访问 权 
限 。 测 试 你 的 工作 。 同 时 ， 运 行 任意 的 性 能 监控 器 或 者 分 析 工具 。 





关键 记 
每 周 7 天 ， 每 天 24 小 时 高 级 加 密 系统 (AES) 认证 
穷 举 攻 击 认证 中 心 冷战 
计算 机 辅助 软件 工程 (CASE) 数据 管理 数据 管理 员 (DA) 
数据 库 管理 数据 库 管理 员 (DBA) 灾难 应 急 计划 
加 密 GRANT 热 站 
逻辑 安全 元 数据 物理 安全 
私有 密 钥 公有 密 钥 REVOKE 
RSA 加 密 角色 模式 
Shell site 快照 表 空 间 
调整 WITH GRANT OPTION 

复习 题 


1. 数据 管理 员 的 角色 和 目的 是 什么 ? 
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2. 数据 库 管理 员 执 行 什么 任务 ? 

3. 有 哪些 监控 数据 库 性 能 的 工具 ? 

4. 应 该 监控 数据 库 的 哪些 方面 以 避免 性 能 问题 ? 
5. 在 开发 数据 库 应 用 中 ，DA 是 如 何 利用 团队 的 ? 
6. 商业 活动 中 的 主要 安全 威胁 是 什么 ? 

7. 如 何 用 热 站 来 保护 商业 应 用 ? 

8. 逻辑 安全 系统 面临 着 哪 三 个 问题 ? 

9. 在 安全 系统 中 鉴别 用 户 身 份 有 哪些 基本 的 方法 ? 
10. 赋 给 用 户 的 基本 数据 库 特 权 有 哪些 ? 

11. 查询 如 何 提供 详细 的 访问 控制 ? 

12. 好 的 DBMS 应 用 如 何 提供 职责 分 隔 ? 

13. 为 什么 在 安全 数据 库 中 加 密 是 一 个 重要 步骤 ? 

14. 双 密 钥 加 密 系统 如 何 同时 提供 安全 和 认证 ? 


练习 


1. 扩展 图 9-16 的 例子 。 给 Employee 表 添加 Title (头衔 )。 创 建 两 个 电话 本 。 一 个 可 由 所 有 的 
雇员 访问 ， 并 让 他 们 看 到 除了 头衔 含有 单词 “Executive” 以 外 的 所 有 人 的 电话 号 码 。 第 二 
个 是 给 主管 的 ， 列 出 所 有 雇员 的 电话 号 码 。 
. 当 有 人 绊 倒 了 计算 机 的 电源 线 时 ，DBMS 正 在 记录 着 一 些 相 关 更 新 事务 。 描 述 DBMS 保 护 
和 焦 复 数据 库 所 采用 的 步骤 。 
. 简要 描述 在 下 列 问题 中 ， 如 何 保护 计算 机 系统 。 
a. 一 个 刚 被 解雇 的 员工 偷 走 了 整个 客户 表 并 卖 给 了 竞争 对 手 。 
b. CEO 生 日 蛋糕 上 的 暴 烛 点 燃 了 他 的 PPDA， 然 后 他 把 PDA 殷 进 了 垃圾 桶 。 接 着 大 火烧 光 了 
数据 中 心 。 
c. 磁盘 故障 。 
d. 汽车 从 路 上 飞 出 ， 樟 翻 了 主要 电源 线 ， 恢 复 设施 的 电源 需要 6 个 小 时 。 
e. CFO 丢 失 了 手机 /PDA， 然 后 有 人 用 存储 的 密码 从 他 的 账户 偷 钱 。 
f. 一 个 检察 官 指控 你 的 公司 违反 了 1996 年 的 《健康 保险 可 携带 性 与 责任 法 》 隐 私法 律 。 
g. 主管 的 助手 私自 提高 供应 商 的 付款 ， 并 把 多 余 的 钱 移 进 了 她 的 银行 账户 里 。 
h. 一 个 受 雇 的 程序 员 用 软件 通过 转换 数据 到 他 的 个 人 账户 偷 了 250 万 美元 ， 现 在 巴西 生活 。 
i. 检察 官 以 伪造 金融 报告 而 依 《 萨 班 斯 -奥克斯 菜 法 案 》 控 告 CEO 和 CEFO。 
j. 一 个 利用 了 DBMS 软 件 漏洞 而 发 起 的 自动 攻击 刚刚 击 跨 了 数据 库 服务 器 。 
. 解释 为 什么 对 事务 数据 库 进 行 每 周 7 天 ， 每 天 24 小 时 持续 访问 会 使 备份 和 安全 更 加 困难 ? 
. 当前 美国 有 哪些 针对 数据 隐私 的 法 律 ? 当前 欧盟 又 有 哪些 针对 客户 隐私 的 法 规 ? 数据 库 管 
理 员 如 果 要 确保 数据 的 隐私 性 ， 需 要 哪些 步骤 ? 
. 你 正在 为 一 个 电子 商务 网 站 创建 安全 措施 。 网 站 应 用 下 面 这 些 表 : 


Customer (CustomerID， Name, Address,...) 


人 > 


Oy 


mn 心 


[ey 


Items (ItemID, Description, ListPrice, QOH) 
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Sale (SaleID, CustomerID, SaleDate, IPAddress, 
CCNumber, ...) 
SaleItem(SaleID, ItemID, SalePrice, Quantity) 


为 下 列 用 户 对 每 张 表 定义 访问 权限 经理、 配送 员 以 及 使 用 网 站 的 客户 。 定 义 需 要 的 
查询 来 保证 安全 条 件 。 
为 包括 下 述 表 的 医师 办 公 室 建立 一 个 小 型 收费 数据 库 : 
Client (ClientID, Name, Address, DOB, Gender,...) 


Staff (StaffID, Name, Specialty,...) 


Visit (VisitID, ClientID, DateTime, Charge, InsuranceCompany, 
InsuranceID) 


Sy 


TreatmentCode (TreatmentCode, Description, Cost) 
Treatment (VisitID, TreatmentCode, Comments, Charge) 
Insurance (CompanyID， Contact, Phone, EDIAddress) 


对 下 列 用 户 为 每 张 表 定 义 访问 权限 : 医师 、 会 计 、 办 事 员 ( 预 留 ) 、 客 户 (如 果 你 创 

建 网 站 )、 保 险 公司 。 定 义 需要 的 查询 来 保证 安全 条 件 。 

.雇员 和 其 他 内 部 人 员 往 往 给 公司 带 来 最 多 的 安全 问题 。 简 要 列 出 为 了 保护 计算 机 系统 而 必 

须 实现 的 联机 基本 方针 和 程序 。 (提示 : 研究 雇员 的 雇佣 程序 。) 

Sally 的 宠物 商店 

9. 为 Sally 的 宠物 商店 设计 一 个 安全 计划 。 鉴 别 不 同类 的 用 户 ,并 确定 每 个 组 需要 的 访问 级 别 。 
为 提供 需要 的 安全 性 可 以 创建 任意 查询 。 

10. 如 果 不 存在 ， 就 创建 一 个 使 用 Customer、Sales、SaleItems、Employee 和 City 表 中 数据 的 销 
售 查询 ， 产 生 一 个 按 州 排序 的 所 有 销售 的 报表 。 用 查询 分 析 器 来 评估 这 个 查询 ， 并 找 出 提 
高 它 性 能 的 方法 。 

11. 创建 一 个 用 于 Sally 的 宠物 商店 的 备份 和 恢复 计划 。 确 定 所 用 的 技术 ， 谁 将 负责 以 及 备份 的 
频率 。 解 释 随 着 商店 和 数据 库 的 增长 这 个 处 理 过 程 如 何 变化 。 

12. 为 保护 数据 库 和 硬件 需要 哪些 物理 安全 方面 的 控制 ? 

Rolling Thunder 自 行车 

13. 为 Rolling Thunder 自 行车 设计 一 个 安全 计划 。 鉴 别 不 同类 的 用 户 ， 并 确定 每 个 组 需要 的 访 
问 级 别 。 为 提供 需要 的 安全 性 可 以 创建 任意 查询 。 

14. 为 Rolling Thunder 自 行车 设计 一 个 备份 和 恢复 计划 。 确 保 指定 哪些 数据 需要 备份 以 及 备份 
的 频率 。 简 要 列 出 针对 公司 的 一 个 基本 的 灾难 应 急 计划 。 应 用 中 哪里 最 有 可 能 存在 安全 问 
题 ? 如 何 分 割 职责 来 提高 安全 性 ? 

15. 对 DBMS 使 用 性 能 分 析 工 具 ， 评 估 表 、 查 询 、 表 单 和 报表 。 给 出 前 5 个 建议 的 解释 。 

16. 分 析 BikeOrderReportQuery， 找 出 该 查询 中 可 以 提高 性 能 的 部 分 并 修改 之 。 

17. 经 理 们 希望 切换 到 无 线 网 络 ， 其 至 还 想 让 系统 允许 他 们 使 用 远程 PDA 或 手机 连接 数据 库 和 
检查 进展 。 为 保护 这 些 系统 的 数据 库 写 一 个 安全 计划 。 

18. 公司 计划 建 一 个 网 站 ， 使 客户 可 以 通过 因特网 进入 并 跟踪 他 们 的 订单 。 解 释 额 外 需要 的 安 
全 过 程 。 


oo 
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分 布 式 数据 库 和 因特网 


本 章 学 习 内 容 


。 为 什么 公司 需要 分 布 式 数据 库 ? 

。 分 布 式 数据 库 产 生 和 加 剧 了 什么 问题 ? 

。 客 户 机 /服务 器 应 用 的 优势 和 缺陷 各 是 什么 ? 

。 在 应 用 中 三 层 的 客户 机 /服务 器 模式 提供 了 哪些 灵活 性 ? 

。 如 何在 Web 服 务 器 上 使 用 数据 库 创建 交互 式 的 因特网 应 用 ? 
。 在 分 布 式 的 客户 机 /服务 器 应 用 中 会 出 现 哪 些 问 题 ? 


10.1 开发 漫谈 


Ariel. 新 工作 如 何 ，Miranda? 

Miranda: 非常 不 错 ! 和 其 他 开发 者 一 起 工作 很 有 意思 。 

Ariel; 尔 还 没 对 这 份 工作 厌烦 啊 ? 

Miranda: 没有 啊 。 我 觉得 这 件 事 压根 儿 不 会 发 生 一 一 万 物 都 在 变化 之 中 。 现 在 他 们 想 让 
我 为 销售 应 用 建立 一 个 网 站 。 在 网 站 上 ， 客 户 可 以 查看 订单 信息 ， 可 能 再 加 
入 新 的 订单 。 

Ariel: 看 来 很 难 啊 。 我 知道 一 些 HTML， 可 我 对 如 何 通过 网 络 访 问 数据 库 一 无 所 知 。 

Miranda， 噢 ， 现 在 有 一 些 好 用 的 工具 。 利 用 SQL， 再 编 一 点 儿 程 序 ， 应 该 不 会 那么 难 。 

Ariel， 是 个 很 好 的 机 会 。 如 果 你 学 会 如 何 建立 能 访问 数据 库 的 站 点 ， 你 就 在 哪儿 都 
能 找到 工作 了 。 


10.2 简介 


当今 即使 是 小 型 商务 应 用 也 使 用 多 台 计 算 机 ， 至 少 也 会 有 多 台 个 人 计算 机 。 更 真实 的 情况 
是 ， 大 多 数 现代 企业 都 会 利用 计算 机 网 络 的 优势 ， 在 多 台 计 算 机 上 安装 部 分 数据 库 和 应 用 。 
当 公司 在 新 地 方 设 办 事 处 时 ， 需 要 跨越 更 远 的 距离 共享 数据 。 渐 渐 地 ， 很 多 公司 越 来 越 觉得 
同 世界 各 地 的 人 分 享 数据 有 用 且 必 要 。 制 造 业 的 公司 需要 同 供应 商 、 发 行商 和 客户 联系 ;， 服 
务 型 公司 需要 同和 雇员 或 合作 伙伴 分 享 数据 。 所 有 这 些 情况 都 是 分 布 式 数据 库 的 例子 。 许 多 应 
用 都 可 以 借助 因特网 的 能 力 优势 和 万 维 网 (WWW) 的 表示 标准 。 

构建 跨 网 络 的 应 用 和 管理 分 布 式 数据 库 是 很 复杂 的 任务 ， 其 目标 是 对 用 户 提供 场地 透明 





性 。 用 户 无 需 知道 数据 在 哪里 存放 。 这 些 特性 需要 一 个 好 的 DBMS、 一 个 可 靠 的 网 络 和 一 个 较 
大 的 数据 库 ， 还 有 网 络 和 安全 的 管理 技能 。 尽 管 困难 重重 ,一 个 设计 良好 的 分 布 式 数 据 库 却 
可 以 使 公司 更 容易 地 扩展 它 的 业务 。 

因特网 和 万 维 网 渐渐 用 来 共享 数据 。 因 特 网 最 基本 的 功能 之 一 就 是 定义 了 用 户 如 何 连 接 服 
务 器 以 及 数据 如 何 显示 的 一 系列 标准 。 通 过 开发 运行 在 网 站 上 的 应 用 ， 你 就 获得 了 最 大 的 系 
统 兼容 性 和 可 访问 性 。 构 建 网 上 数据 库 应 用 和 构建 一 般 的 数据 库 应 用 很 类 似 ， 只 需要 多 学 一 
些 工具 和 标准 就 可 以 了 。 


10.3 Sally 的 宠物 商店 


数据 库 已 经 在 Sally 的 宠物 商店 运行 ， 而 且 正 在 赢利 。 现 在 她 希望 扩张 ， 正 在 计划 开 第 二 
家 商店 。 同 时 筹备 建立 网 站 ， 以 便 用 户 订 购 商 品 、 查 看 新 动物 以 及 获得 一 些 照 顾 宠 物 的 帮助 。 
首先 Sally 希 望 将 你 的 工作 变 成 全 职 的 。 她 需要 有 人 帮 她 管理 计算 机 的 日 常事 务 、 修 改 程序 以 
及 培训 其 他 员工 。 

Sally 把 数据 库 扩展 到 第 二 个 商店 的 要 求 引 发 了 很 多 问题 。 她 需要 随时 对 两 个 商店 的 销售 
数据 都 能 “实时 ”访问 吗 ? 两 个 商店 之 间 需 要 彼此 分 享 数据 吗 ? 比如， 一 种 产品 在 一 家 商店 
脱销 ，Sally 需 要 系统 自动 去 检查 另 一 个 吗 ? 商 店 的 操作 需要 某 种 独立 性 吗 一 一 销售 和 财务 数据 
由 两 个 商店 分 别 维护 一 一 或 者 数据 总 是 整合 成 一 体 ? 数据 需要 怎样 更 新 ?只 有 了 昨天 的 库存 数据 
可 以 吗 一 一 还 是 必须 按 分 钟 更 新 ? 

这 些 问 题 的 答案 将 决定 一 些 至 关 重 要 的 设计 思路 。 特 别 地 ， 主 要 的 设计 问题 就 是 回答 是 否 
有 一 个 核心 的 或 单独 的 、 分 布 式 的 数据 库 控 制 每 家 商店 的 销售 。 答 案 取决 于 商店 如 何 管理 ， 
需要 数据 的 类 型 ， 网 络 性 能 和 成 本 以 及 DBMS 的 能 力 。 

许多 方法 最 初 、 也 是 最 经 济 的 做 法 就 是 让 第 二 个 商店 完全 独立 。 这 样 ， 除 了 在 一 个 账 务 周 
期 结束 后 检查 一 些 基 本 的 财务 数据 外 ， 无 需 共享 。 这 种 方法 的 第 二 个 优点 是 易于 扩展 ， 因 为 
每 个 新 商店 都 是 独立 的 。 类 似 的 情况 是 ， 如 果 某 商店 的 计算 机 系统 出 了 故障 ， 也 不 会 影响 其 
他 商店 。 

尽管 如 此 ， 从 某 些 角 度 考 虑 ， 很 可 能 Sally 还 是 希望 数据 能 更 紧密 地 集成 。 例 如 ， 从 其 他 
商店 检查 库存 的 能 力 对 用 户 来 说 很 有 用 ， 这 也 就 意味 着 这 个 应 用 将 需要 从 存放 在 不 同 商店 的 
若干 个 数据 库 中 提取 信息 。 这 些 数据 库 必 须 通过 电信 线路 联网 。 物 理 地 连接 计算 机 有 很 多 方 
法 ， 你 需要 学 习 一 门 电信 课程 才能 理解 不 同 的 选项 。 一 旦 计算 机 物理 地 连接 在 一 起 ， 就 需要 
处 理 一 些 关于 创建 和 管理 分 布 式 数据 库 的 额外 问题 。 

因特网 迅速 成 为 连接 客户 和 共享 信息 的 首选 方法 。 把 数据 库 连 接 到 网 络 上 是 一 种 非常 强大 
的 方法 ， 它 可 以 提供 实时 数据 ， 并 使 客户 能 够 找到 他 们 需要 的 确切 信息 。 要 理解 如 何 把 数据 
库 连 接 到 网 站 上 ， 首 先 学 习 一 些 分 布 式 数据 库 的 知识 是 很 有 用 的 。 


10.4 分 布 式 数据 库 


分 布 式 数据 库 系 统 由 多 个 独立 的 数据 库 组 成 ， 运 行 在 两 个 或 两 个 以 上 通过 网 络 连接 在 一 起 
并 共享 数据 的 计算 机 上 。 这 些 数据 库 通常 都 处 在 不 同 的 物理 场地 。 每 个 数据 库 都 由 一 个 独立 
的 DBMS 控 制 ， 这 个 DBMS 确 保 自己 数据 库 的 完整 性 。 极 端的 情况 是 ， 各 数据 库 可 能 安装 在 不 
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同 的 硬件 上 ， 使 用 不 同 的 操作 系统 ， 甚 至 还 可 能 使 用 不 同 商家 的 DBMS 软 件 。 最 后 一 种 偶然 情 
况 是 最 难处 理 的 。 如 果 所 有 的 环境 都 运行 在 同一 个 商家 的 DBMS 软 件 上 ， 那 么 当前 的 大 多 数 分 
布 式 数据 库 都 会 表现 得 很 好 。 

在 图 10-1 的 例子 里 ， 公 司 可 能 在 3 个 不 同 的 
国家 都 有 办 公 室 ， 每 个 办 公 室 都 有 自己 的 计算 机 
和 数据 库 。 大 部 分 数据 只 在 各 办 公 室 内 部 。 例 如 ， 
在 美国 的 员工 基本 不 需 看 到 法 国 员 工 的 日 程 安 
排 。 另 一 方面 ， 在 法 国 和 英国 的 员工 可 能 都 为 同 
一 个 大 型 国际 项 目 工 作 。 网 络 和 分 布 式 数据 库 让 
他 们 能 够 分 享 数据 ， 就 像 所 有 的 信息 都 在 一 起 似 
地 对 待 项 目 。 

分 布 式 数据 库 可 能 组 织 成 若干 种 结构 。 当 今 
最 流行 的 方式 包括 客户 机 /服务 器 方法 。 在 客户 
机 /服务 器 系统 中 ， 服 务 器 计算 机 更 加 强大 ， 为 
许多 客户 机 提供 数据 。 客 户 计 算 机 通常 是 带 有 图 





图 10-1 分 布 式 数据 库 。 每 个 办 公 室 有 自己 的 硬 


形 用 户 界面 的 个 人 计算 机 。 客 户 机 就 是 对 用 户 提 件 和 和 数据库， 对 于 国际 项 目 ， 不 同 办 公 
供 界面 ， 收 集 和 显示 数据 ， 并 且 给 适当 的 服务 器 室 的 员工 可 以 轻易 地 共享 数据 。 员 工 不 
返回 数据 。 需要 知道 数据 存储 在 不 同 的 地 广 
10.4.1 目标 和 规则 


创建 一 个 能 充分 支持 分 布 式 数 据 库 的 DBMS 是 很 难 的 (主要 的 问题 将 在 后 面 几 节 中 介绍 )。 
事实 上 ， 早 期 的 系统 面临 着 各 种 问题 。 因 此 ， 一 些 人 就 想 出 了 一 系列 的 目标 或 规则 ， 制 定 了 
分 布 式 DBMS 所 应 该 拥有 的 特性 。 同 E. F. Codd 一 起 做 过 关系 数据 库 方 法 定义 的 C. J. Date 列 出 
了 他 感觉 比较 重要 的 一 些 规则 。 这 一 节 我 们 就 来 总 结 Date 的 规则 。 

不 管 是 谁 对 分 布 式 数据 库 进行 定义 ， 最 重要 的 规则 就 是 用 户 无 需 知道 或 者 关注 数据 库 是 分 
布 式 的 。 例如， 用 户 应 该 能 够 像 数 据 库 在 一 台 计 算 机 上 一 样 创建 和 运行 简单 查询 。 在 屏幕 背后 ， 
DBMS 可 能 连接 3 台 不 同 的 计算 机 ， 收 集 数据 ， 并 格式 化 结果 。 但 是 用 户 却 不 知道 这 些 细节 。 

作为 这 个 规则 的 一 部 分 ， 数 据 应 该 独立 于 场地 而 存放 。 例 如 ， 如 果 业 务 改变 ， 应 该 可 以 很 
简单 地 把 数据 从 一 台 计 算 机 移出 ， 并 放 到 另 一 个 办 公 室 去 。 这 种 转移 不 应 该 影响 整个 应 用 ， 
只 需 应 用 进行 极 少 的 修改 就 能 继续 运行 。 系 统 不 应 该 依赖 中 央 计算 机 来 调节 其 他 计算 机 ， 相 
反 ， 每 台 计 算 机 都 应 该 能 够 按照 需要 同 其 他 计算 机 联系 。 这 种 独立 性 提升 了 系统 性 能 ， 并 且 ， 
即使 有 二 人 台 计 算 机 或 部 分 网 络 出 了 故障 ， 其 他 办 公 室 还 可 以 继续 运行 。 

还 有 一 些 目标 就 更 加 理想 化 了 。DBMS 应 该 独立 于 硬件 和 操作 系统 ， 这 样 ， 当 需要 更 新 、 
更 快 的 计算 机 时 ， 公 司 就 可 以 方便 地 把 软件 和 数据 转移 到 新 机 器 上 ， 并 且 业 务 操作 和 过 去 一 
样 。 类 似 地 ， 如 果 系 统 独立 于 所 在 的 网 络 也 有 好 处 。 大 多 数 情况 下 ， 网 络 都 是 由 不 同 公司 的 
设备 和 软件 构建 而 成 的 。 优 秀 的 分 布 式 DBMS 应 该 可 以 跨越 不 同 的 网 络 工 作 。 最 后 ， 如 果 分 布 
式 应 用 不 依赖 于 某 商 家 的 DBMS 软 件 ， 那 就 更 好 了 。 比 如 ， 如 果 两 家 公司 要 合并 ， 而 他 们 只 需 
要 安装 一 个 网 络 连接 就 可 以 让 所 有 的 应 用 继续 工作 ， 那 就 太 棒 了 一 一 即使 两 家 公司 使 用 不 同 的 
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网 络 ， 不 同 的 硬件 ， 以 及 不 同 商家 的 数据 库 软 件 。 这 种 理想 化 的 境界 目前 还 不 存在 。 但 是 ， 
像 Oracle 这 样 的 系统 ， 提 供 了 针对 这 些 目标 的 许多 组 件 。 

需要 这 些 特性 是 因为 公司 在 不 丢弃 现 有 工作 的 前 提 下 ， 可 以 比较 轻易 地 扩展 或 修改 数据 库 
和 应 用 。 通 过 提供 硬件 、 软 件 和 网 络 组 件 的 混合 ， 这 些 目标 也 使 得 企业 可 以 选择 最 适合 他 们 
需要 的 组 件 。 


10.4.2 优点 和 应 用 


分 布 式 数据 库 方法 的 主要 长 处 就 是 它 配合 了 企业 运作 的 方式 。 业 务 操作 常常 是 跨越 场地 分 
布 的 。 例 如 ， 工 作 和 数据 都 通过 部 门 分 成 很 多 部 分 。 每 个 部 门 的 员工 都 同 部 门 内 的 其 他 员工 
共享 大 部 分 数据 和 通信 。 但 也 有 一 些 数据 需要 同 公司 的 其 他 部 门 分 享 。 类 似 地 ， 较 大 的 公司 
常常 在 不 同 的 地 理 区 域 拥 有 办 公 室 。 同 样 ， 收 集 来 的 许多 数据 都 是 在 本 区 域内 部 使 用 的 ， 但 
也 有 一 些 数据 需要 同 不 同 区 域 的 员工 分 享 。 

共享 数据 有 3 种 基本 架构 : (1) 一 台中 心计 算 机 收集 和 处 理 所 有 数据 ， (2) 每 个 办 公 室 都 
有 一 个 与 其 他 部 门 不 共享 数据 的 独立 的 计算 机 系统 ， (3) 分 布 式 数据 库 系统 。 

第 二 个 方案 是 可 行 的 一 一 只 要 这 个 办 公 室 极 少 需要 共享 数据 。 许 多 情况 下 ， 它 仍然 是 常用 
的 方法 。 需 要 共享 的 数据 通过 纸 质 报 表 、 传 真 、 电 话 或 电子 邮件 传送 。 当 然 ， 这 些 共享 数据 
的 方法 都 很 低 效 。 

一 些 早期 的 计算 机 系统 使 用 第 一 种 方案 。 把 所 有 的 数据 传送 到 中 央 计算 机 的 做 法 有 很 多 缺 
点 。 特 别 地 ， 把 数据 都 传 到 一 个 场地 代价 很 高 ， 
如 果 那 个 计算 机 发 生 故 障 ， 整 个 系统 就 会 瘫 病 。 

图 10-2 展 示 分 布 式 数据 库 方法 的 一 些 优 点 。 
首先 ， 分 布 式 系统 通过 更 好 地 协调 企业 的 需求 而 
提供 了 重要 的 性 能 优势 。 大 部 分 更 新 和 查询 都 在 
本 地 执行 。 每 个 办 公 室 都 保留 了 本 地 控制 ， 并 对 
数据 负责 。 然 后 系统 能 够 让 任何 有 适当 权限 的 人 ， 
在 公司 的 任何 地 方 按 需 提取 和 集合 数据 。 

同 集中 式 系统 相 比 ， 分 布 式 数 据 库 的 第 二 个 
优点 是 更 容易 扩展 。 想 想 如 果 公 司 在 使 用 一 个 大 
型 的 、 集 中 式 的 计算 机 时 会 发 生 什 么 。 如 果 公 司 
扩展 到 一 个 新 地 区 ， 需 要 更 多 的 处 理 能 力 ， 那 么 
整个 计算 机 可 能 被 换 掉 。 有 了 分 布 式 数据 库 方法 ， 
扩展 到 一 个 地 区 只 需要 增加 二 台 带 有 支持 新 操作 ”图 10-2 分 布 式 数据 库 的 优势 。 大 部 分 数据 都 在 





的 数据 库 的 计算 机 就 可 以 了 。 所 有 现存 的 硬件 和 Net he 
D ,通关 和 统 ， , 行 传输 。 系 统 很 灵活 ， 
应 用 都 能 保持 原样 。 通 过 使 用 更 小 的 计算 机 系统 er 


可 以 更 方便 和 便宜 地 配合 企业 变化 的 需要 。 

由 于 分 布 式 数 据 库 方法 与 在 何 一 家 公司 的 业务 布局 相 匹配 ， 所 以 有 很 多 应 用 可 以 借助 它 来 
实现 。 其 中 常见 的 两 类 就 是 事务 处 理 和 决策 支持 。 在 事务 处 理 系统 中 ， 每 个 地 区 都 负责 收集 
它 日 常用 到 的 详细 事务 数据 。 例 如 ， 一 个 制造 厂家 可 能 有 一 个 收集 和 存储 购买 、 人 了 奈 关 系 、 
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产品 的 数据 库 。 这 些 数据 的 大 部 分 被 单独 的 厂家 管理 。 作 为 共同 网 络 的 一 部 分 ， 每 个 厂家 收 
集 的 汇总 数据 都 发 回 总 公司 进行 分 析 。 另 一 个 例子 ， 考 虑 一 家 在 多 国都 有 办 公 室 的 咨询 公司 。 
员工 们 可 以 把 他 们 的 笔记 和 注释 存在 本 地 数据 库 里 。 如 果 某 个 国家 的 客户 需要 特殊 的 帮助 或 
遇 到 独特 的 问题 ， 本 地 的 合伙 人 就 可 以 用 数据 库 在 世界 上 其 他 办 公 室 搜索 类 似 的 案例 和 解决 
方案 。 分 布 式 数 据 库 可 以 让 公司 的 员工 分 享 他 们 的 知识 和 经 验 。 


10.4.3 创建 分 布 式 数 据 库 系统 


创建 分 布 式 数据 库 的 基本 步 又 和 创建 任何 数据 库 应 用 是 类 似 的 。 一 旦 确定 了 用 户 需求 ， 开 
发 者 们 就 会 通过 规范 化 组 织 数据 ， 使 用 SQL 创建 查询 ， 定 义 用 户 接口 ， 并 创建 整个 应 用 。 尽 管 
如 此 ， 如 图 10-3 所 示 ， 创 建 分 布 式 数据 库 还 需要 一 些 额 外 的 步 归 。 需 要 网 络 来 连接 各 个 场地 的 
计算 机 。 即 使 网 络 已 经 存在 ， 也 可 能 需要 经 过 修改 或 扩展 ， 才 能 支持 选 定 的 硬件 和 DBMS 软 件 。 


。 设 计 管理 计划 

。 选 择 硬件 、DBMS 厂 商 和 网 络 
。 建 立 网 络 和 DBMS 连 接 

， 选 择 数 据 的 场地 


。 选 择 复制 策略 

。 创建 备份 计划 和 策略 

。 创建 本 地 视图 和 同义词 表 

。 执行 压力 测试 ， 负荷 和 失败 





图 10-3 创建 分 布 式 数据 库 的 额外 步 又。 独立 的 系统 和 网 络 安装 好 以 后 ， 需 要 
选择 在 哪里 存放 数据 。 数 据 可 能 复制 并 存放 在 多 个 场地 。 本 地 视图 和 
同义词 表 用 来 提供 透明 性 和 安全 性 。 确 保 对 应 用 进行 重度 负荷 下 的 压 
力 测试 ， 并 且 保 证 它们 可 以 处 理 网 络 和 远程 计算 机 的 失败 
另 一 个 关键 的 步 又 就 是 确定 在 哪里 存储 数据 。 下 一 节 将 谈 到 在 分 布 式 数据 库 上 处 理 查询 时 
可 能 会 磁 到 的 一 些 问 题 。 现 在 ， 只 要 记得 目标 是 把 数据 尽 可 能 近 得 存放 到 使 用 最 频繁 的 场地 
就 行 了 。 也 有 可 能 把 频繁 使 用 的 数据 复制 多 份 ， 使 得 它们 可 以 存储 在 多 台 计 算 机 上 。 当 然 ， 
接 下 来 你 得 选择 并 实现 一 种 策略 来 确保 每 份 副本 都 保持 最 新 。 
备份 和 恢复 计划 在 分 布 式 数据 库 中 更 加 关键 。 记 得 不 同 的 计算 机 可 能 会 运行 在 不 同 的 场 
地 。 每 个 系统 很 可 能 有 不 同 的 DBA。 然 而 整个 数据 库 必须 进行 保护 以 防 失败 ， 所 以 每 个 系统 
都 必须 有 一 致 性 备份 和 安全 计划 。 开 发 这 些 计划 需要 管理 员 进 行 协商 ， 尤 其 当 系统 跨越 国界 
或 多 个 时 区 时 。 例 如 ， 同 时 备份 所 有 地 点 的 数据 事实 上 是 不 可 能 的 。 
一 旦 独立 的 系统 安装 好 并 运行 起 来 ， 每 个 场地 必须 创建 本 地 视图 、 同 义 词 表 ， 存 储 连 接 数 
据 库 的 过 程 ， 对 适当 的 用 户 分 发 权限 ， 并 连接 运行 在 每 个 系统 上 的 应 用 。 每 个 独立 的 连接 必 
须 经 过 测试 ， 整 个 应 用 也 要 在 连接 性 和 重度 负荷 的 压力 两 方面 进行 测试 。 同 时 还 应 该 在 网 络 
连接 中 斯 或 远程 计算 机 失败 时 测试 其 行为 。 
运行 和 管理 一 个 分 布 式 数据 库 比 管理 单独 的 数据 库 要 困难 多 了 。 确 定 问题 的 原因 就 很 麻 
烦 。 像 备份 和 恢复 这 样 基本 的 任务 都 需要 所 有 DBA 之 间 进 行 协 调 。 一 些 有 用 的 工具 可 以 使 这 
些 工作 简化 。 
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不 知 你 是 否 记得 分 布 式 数 据 库 应 该 对 用 户 透明 这 个 规则 ? 相同 的 规则 却 并 不 适用 于 DBA 
或 应 用 开发 者 。 管 理 员 和 开发 者 之 间 的 协调 对 于 使 应 用 更 具 可 访问 性 是 十 分 关键 的 。 


10.4.4 分 布 式 查询 处 理 


分 布 式 数 据 库 的 挑战 落 到 了 物理 学 和 经 济 学 。 如 图 10-4 所 示 ， 存 储 在 本 地 磁盘 上 的 数据 可 


以 以 20~60 兆 字 节 每 秒 (或 更 高 ) 的 传输 速率 传送 到 
CPU。 连 接 到 局 域 网 (LAN) 存储 在 服务 器 上 的 数据 可 
以 以 1~10 兆 字 节 每 秒 (10~100 兆 位 每 秒 ) 的 速率 传输 。 
也 就 是 说 ， 局 域 网 的 平均 传输 速率 比 磁盘 直接 传输 慢 10 
倍 。 使 用 连接 到 广域网 (WAN) 的 公用 传输 线路 只 能 提 
供 0.01~5 兆 字 节 每 秒 的 速率 。 为 获得 5 兆 字 节 每 秒 (在 
T3 线 路 上 ) ， 你 的 公司 很 可 能 每 月 至 少 得 付出 1 万 美金 。 
随 着 技术 的 进步 ， 这 些 数 字 会 持续 提高 ， 但 这 种 对 比 关 
系 将 保持 不 变 。 即 ， 本 地 磁盘 的 传输 要 比 局 域 网 快 ， 而 


局 域 网 比 广 域 网 快 。 尽 管 如 此 ， 注 意 本 地 速度 的 提高 已 . 


经 推动 了 存储 区 域 网 (SAN) 的 使 用 ，SAN 利 用 千 兆 位 
(GB) 网 络 加 快 了 处 理 机 的 单独 的 驱动 器 速度 。 尽 管 存 
储 区 域 网 提供 了 一 些 运行 服务 器 的 优势 ， 但 因为 距离 有 
限 ， 还 是 没 能 解决 分 布 式 数据 库 的 问题 。 





图 10-4 网 络 传输 速率 。 磁 盘 的 传输 比 
局 域 网 快 ， 而 局 域 网 又 比 广 域 
网 快 。 高 速 的 广域网 传输 要 比 
其 他 传输 方法 昂贵 得 多 


分 布 式 处 理 的 目标 就 是 在 较 慢 的 网 络 上 最 小 化 数据 的 传输 ， 降 低 网 络 传输 的 代价 。 这 些 目 
标 中 的 一 部 分 可 以 通过 设计 来 达到 一 一 开发 者 们 必须 仔细 选择 数据 在 哪里 存放 。 数 据 应 该 尽 可 
能 近 地 存 放 到 它 使 用 最 频繁 的 地 方 。 但 是 ， 数 据 需 要 在 多 个 场地 使 用 时 又 会 有 一 个 折 中 的 问题 。 


由 于 查询 处 理 还 引发 了 数据 传输 的 另 一 个 
问题 。 如 果 一 个 查询 需要 从 不 同 的 计算 机 上 提 
取 数 据 ， 那 么 传输 这 些 数 据 并 处 理 查询 的 时 间 
极 大 地 取决 于 有 多 少数 据 必 须 传输 ， 以 及 传输 
线路 的 速度 如 何 。 因 此 ， 其 结果 取决 于 DBMS 
如 何 从 多 个 表 中 连接 数据 。 在 一 些 情况 下 ， 差 
异 是 极其 明显 的 。 一 种 方法 可 能 在 数秒 内 得 到 
结果 ， 同 一 个 查询 的 另 一 种 不 同 的 方法 可 能 需 
要 处 理 很 多 天 ! 理想 情况 下 ，DBMS 应 该 对 查 
询 、 使 用 的 数据 库 以 及 传输 时 间 进 行 估计 ， 确 
定 一 个 回答 查询 的 最 有 效 的 途径 。 

图 10-5 表 示 这 个 基本 的 问题 。 考 虑 在 3 个 不 
同 数 据 库 上 的 一 些 表 : (1) 在 纽约 有 1 百 万 行 记 图 10-5 
录 的 表 Customer，(2) 在 洛杉矶 有 1 千 万 行 的 表 
Production 以 及 (3) 在 芝加哥 有 2 千 万 行 的 表 
Sales。 一 位 在 芝加哥 的 经 理 要 进行 下 面 的 查询 : 





分 布 式 数据 库 查 询 的 例子 。 列 出 在 3 月 1 
日 购买 了 蓝 色 产 品 的 顾客 名 单 。 不 好 的 
处 理 方法 把 所 有 的 数据 都 传 给 芝加哥 。 
优化 的 目标 是 限制 每 一 个 集合 ， 并 传送 
最 少量 的 数据 
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列 出 在 3 月 1 日 购买 了 蓝 色 产 品 的 顾客 名 单 。 

这 个 查询 可 能 会 有 若干 种 处 理 方式 。 考 虑 一 个 坏 主 意 ， 把 所 有 的 数据 行 都 传送 到 芝加哥 ， 
然后 连接 各 表 并 选择 满足 查询 条 件 的 行 。 这 种 方法 导致 有 1100 万 行 数 据 被 传送 到 芝加哥 。 即 
使 在 相对 快速 的 广域网 内 ， 这 个 查询 能 在 30 分 钟 内 得 到 结果 就 已 经 让 人 吃惊 了 。 

一 个 好 点 儿 的 方法 是 告诉 洛杉矶 的 数据 库 找到 所 有 的 蓝 色 产品 并 把 结果 行 传送 到 芝加哥 。 
假设 仅 有 一 些 产品 是 蓝 色 的 ， 这 种 方法 就 能 明显 地 减少 需要 传送 的 数据 。 性 能 的 提升 取决 于 
含有 蓝 色 产品 的 记录 行 的 百分比 。 

一 个 更 好 的 想法 是 从 芝加哥 的 表 中 得 到 3 月 1 日 卖 出 的 所 有 商品 列表 ， 这 个 不 需要 传输 代 
价 。 然 后 把 这 个 结果 发 给 洛杉矶 ， 让 那 边 的 数据 库 确定 哪些 产品 是 蓝 色 的 。 再 把 匹配 的 
Customer ID 发 给 纽约 的 数据 库 ， 最 后 返回 对 应 的 顾客 数据 。 

注意 ， 为 了 最 优化 查询 ，DBMS 需 要 知道 每 张 表 里 数 据 的 一 些 信息 。 举 个 例子 ， 如 果 在 洛 
杉 矶 的 数据 库 里 有 很 多 蓝 色 产品 而 没有 多 少 3 月 1 日 的 销售 数据 ， 数 据 库 就 应 该 从 芝加哥 发 送 
销售 数据 到 洛杉矶 。 另 一 方面 ， 如 果 没 多 少 蓝 色 产 品 ， 那 么 从 洛杉矶 发 送 产品 数据 到 芝加哥 
就 更 为 高 效 了 。 在 一 些 情况 下 ， 系 统 也 需要 知道 网 络 连接 的 传输 速度 。 一 个 好 的 DBMS 包 含 着 
一 个 查询 优化 器 来 检查 数据 库 内 容 和 网 络 传输 速度 ， 以 选择 回答 一 个 查询 的 最 佳 方案 。 你 仍 
可 能 需要 自己 优化 一 些 查询 ， 基 本 的 规则 就 是 尽 可 能 少 地 传输 数据 。 


10.4.5 数据 复制 


有 时 候 并 没有 一 个 好 的 办 法 来 最 优化 查询 。 当 在 若干 不 同 场地 都 需要 大 的 数据 集 时 ， 复 制 
这 些 表 并 在 每 个 场地 存储 一 个 备份 可 能 会 更 加 高 效 。 问 题 在 于 涉及 的 数据 库 必须 知道 每 一 份 
副本 。 如 果 一 个 用 户 在 某 地 更 新 了 数据 ， 这 个 改变 必须 复制 到 其 他 所 有 的 副本 。DBMS 使 用 复 
制 管理 器 来 确定 应 该 发 送 哪 些 改变 ， 并 处 理 每 个 场地 的 更 新 。 复 制 可 以 在 每 天 特定 的 时 刻 自 
动 发送 ， 或 者 当 有 人 觉得 有 必要 同步 数据 时 手动 触发 。 

开发 者 和 数据 库 管理 员 可 以 通过 指定 数据 库 如 何 复制 来 调整 性 能 。 可 以 控制 改动 多 久 发 布 
一 次 ， 以 及 是 分 块 发 送 还 是 随 整个 表 批 量 传输 。 最 大 的 困难 还 是 有 时 候 网 络 连接 可 能 中 断 或 
服务 器 失败 。 那 时 DBMS 就 必须 协调 数据 库 ， 以 确保 它们 都 保留 表 的 当前 版 本 ， 并 且 不 丢失 任 
何 改动 。 

图 10-6 展 示 复 制 的 基本 概念 。 每 个 地 方 的 市 场 办 公 室 都 有 来 自 英国 和 西班牙 的 Customer 和 
Sales 数 据 副 本 。 几 乎 所 有 的 更 新 都 基于 本 国内 部 的 数据 。 经 理 们 很 可 能 并 不 需要 其 他 国家 来 
的 实时 数据 ， 所 以 表 可 以 在 晚上 批量 地 复制 和 更 新 。 对 于 每 个 地 方 的 经 理 ， 数 据 都 是 可 用 的 ， 
并 且 不 用 考虑 传输 时 间 。 公 司 可 以 通过 在 非 高 峰 时 段 执行 传输 ， 以 最 小 化 国际 传输 费用 。 

事务 处 理 数据 库 通常 会 记录 很 多 变化 ， 有 时 每 分 钟 就 有 几 百 次 。 这 些 应 用 在 处 理事 务 时 需 
要 快速 的 响应 上 时间。 通常 最 好 是 在 本 区 域内 以 分 布 式 数据 库 的 方式 运行 这 些 系统 以 提高 性 能 。 

另 一 方面 ， 不 同 地 方 的 经 理 常 常 需 要 分 析 事 务 数据 。 如 果 让 他 们 直接 访问 分 布 式 事务 数据 
库 ， 这 种 分 析 查询 可 能 降低 事务 系统 的 性 能 。 当 前 流行 的 解决 方案 是 把 事务 数据 复制 到 数据 
仓库 中 。 例 行程 序 从 事务 处 理 系统 中 提取 数据 并 存放 到 数据 仓库 中 。 经 理 们 运行 应 用 程序 并 
创建 查询 ， 从 数据 仓库 中 提取 并 分 析 数 据 ， 制 定 战术 或 战略 决策 。 由 于 经 理 们 几乎 不 会 改变 
这 些 数据 ， 数 据 仓库 就 非常 适合 进行 复制 。 原 先 的 事务 处 理 系 统 保持 它 的 速度 ， 而 且 不 共享 
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原始 数据 。 经 理 们 分 享 数据 仓库 的 访问 权 。 





图 10-6 复制 的 数据 库 。 如 果 经 理 们 不 需要 其 他 国家 的 最 新 数据 ， 这 些 表 就 可 
以 在 晚上 费用 比较 低 时 进行 复制 和 更 新 传输 


自动 码 生 成 在 数据 库 复制 中 是 个 不 小 的 挑战 。 如 果 不 同 场 地 的 两 个 人 都 创建 了 一 个 新 的 客 
户 会 如 何 ? 如 果 码 生成 器 不 同步 ， 那 就 很 可 能 造成 两 个 场地 获得 了 相同 的 码 ， 并 且 当 数据 从 
两 个 场地 进行 更 新 时 ， 冲 突 就 会 发 生 ， 必 须 手 动 来 解决 。 两 个 常用 的 方法 可 以 用 在 分 布 式 数 
据 库 里 来 安全 地 产生 码 : (1) 随机 产生 码 ， (2) 场地 相关 码 。 如 果 生 成 器 从 一 个 足够 大 的 码 
空间 里 选择 码 ， 那 么 就 可 以 随机 生成 码 。 这 样 两 个 同时 生成 的 码 具 有 相同 值 的 概率 就 很 小 。 
安全 起 见 ， 生 成 器 会 立即 检查 刚刚 产生 的 码 是 否 已 经 存在 。 第 二 种 方法 可 以 使 用 序列 码 或 随 
机 码 , 但 依赖 于 每 个 分 配 了 一 个 范围 值 的 场地 。 例 如 ， 一 个 区 域 可 能 分 到 1~1 百 万 的 范围 ， 下 
个 区 域 1 百 万 ~2 百 万 ， 依 此 类 推 。 有 了 场地 相关 的 生成 器 ， 必 须 仔细 隔离 用 于 码 生 成 的 数据 表 。 
例如 ， 你 的 码 表 可 能 包含 场地 标识 符 和 码 的 开始 或 当前 值 。 


10.4.6 并 发 、 锁 和 事务 


并 发 和 死 锁 在 分 布 式 数据 库 中 都 是 很 复杂 
的 问题 。 当 两 个 人 同时 试图 修改 同一 份 数据 时 
会 引发 死 锁 。 通过 封锁 要 修改 的 行 可 以 预防 这 
种 情况 。 如 图 10-7 所 示 ， 分 布 式 数据 库 中 出 现 
的 问题 是 应 用 可 能 引发 涉及 独立 计算 机 上 不 同 
数据 库 的 死 锁 。 一 个 用 户 可 能 持 有 一 台 计算 机 
上 某 个 表 的 锁 ;等 待 另 一 台 计算 机 上 的 资源 。 
想象 一 下 ， 如 果 死 锁 涉及 到 5 个 场地 的 5 个 数据 
库 时 会 如 何 。 发 现 死 锁 问 题 很 困难 。 当 锁 发 生 上 
在 一 台 计 算 机 上 时 ，DBMS 可 以 用 锁 图 来 捕获 

死 锁 的 发 生 。 在 分 布 式 数据 库 环 境 中 ， 等 待 资 ， 国 !” 芭 入 和 天 久未 网 的 数据 库 下 
源 时 DBMS 还 必须 监视 延迟 。 如果 延迟 太 长 ， 使 得 识别 和 解决 死 锁 变 得 更 加 困难 
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系统 假定 有 死 锁 发 生 ， 并 回 滚 事务 。 当 然 ， 延 迟 可 能 缘 于 很 慢 的 网 络 连接 ， 所 以 这 个 方法 也 
不 是 很 安全 。 更 坏 的 情况 是 ， 消 耗 在 等 待 上 的 时 间 都 浪费 掉 了 。 在 繁忙 的 系统 里 ，DBMS 可 能 
会 用 更 多 的 时 间 去 等 待 ， 而 不 是 处 理事 务 。 

处 理 跨越 多 个 数据 库 的 事务 也 是 一 个 更 加 复杂 的 问题 。 当 更 新 需要 写 和 若干 台 计 算 机 时 ， 
必须 确保 所 有 这 些 改变 都 同时 成 功 或 失败 。 到 目前 为 止 ， 检 验 事务 最 通用 的 机 制 还 是 两 阶段 
提交 过 程 。 图 10-8 展 示 了 这 个 过 程 。 发 起 事务 的 数据 库 成 为 协调 者 。 在 第 一 阶段 ， 它 向 其 他 数 
据 库 发 出 更 新 命令 并 让 它们 准备 好 这 个 事务 。 每 个 数据 库 都 必须 针对 它 自己 的 状态 发 送 一 个 
应 答 。 每 个 数据 库 都 必须 同意 执行 整个 事务 ， 或 
按 需 进行 回 滚 。 即 使 有 故障 发 生 ， 数 据 库 也 必须 
同意 进行 更 新 。 换 句 话说 ， 它 把 更 新 都 写 在 事务 
日 志 中 。 一 旦 日 志 成 功 创建 ， 远 程 数 据 库 就 同意 
它 处 理 更 新 。 如 果 某 个 数据 库 碰 到 了 问题 并 无 法 
完成 事务 (或 许 不 能 锁定 某 个 表 ) ， 它 就 发 送 一 
个 失败 信息 ， 然 后 协调 者 就 会 告诉 所 有 的 数据 库 
都 回 滚 它们 的 更 新 。 好 的 DBMS 会 自动 处 理 两 阶 
段 提交 。 作 为 开发 者 ， 只 需要 提交 标准 的 SQL 语 
名 ,DBMS 会 处 理 通信 并 保证 事务 成 功 完成 。 在 
一 些 较 弱 的 系统 里 ， 可 能 还 需要 把 两 阶段 提交 命 
邻 嵌入 到 程序 代码 中 。 如 果 你 知道 在 构建 一 个 使 
用 很 多 分 布 式 更 新 的 应 用 ， 那 么 为 一 个 能 自动 处 ”图 10-8 两 阶段 提交 。 每 个 数据 库 必须 同意 保存 
理 两 阶段 提交 过 程 的 DBMS 准 备 预算 ， 通常 是 较 所 有 的 更 新 一 -即使 系统 崩溃 。 当 所 有 
好 的 选择 。 系统 都 准备 好 时 ， 就 会 让 它们 提交 更 新 

注意 两 阶段 提交 系统 依赖 于 悲观 锁 。 由 于 事务 的 延迟 ， 它 可 能 很 大 程度 上 在 事务 中 降低 
了 所 有 涉及 系统 的 性 能 一 一 因为 它 要 等 待 每 台 计算 机 的 封锁 记录 。 尽 管 乐 观 锁 在 事务 的 一 些 
方面 有 所 帮助 ， 但 当 系 统 或 通信 和 链 路 失败 时 它 还 是 无 能 为 力 。 





10.4.7 独立 的 事务 管理 器 


分 布 式 系统 的 问题 很 难得 到 有 效 解决 ， 特 别 当 数据 库 系 统 来 自 不 同 的 厂商 时 。 图 10-9 展 示 
了 一 个 常见 方法 ,使 用 独立 的 事务 处 理 监 控 器 或 者 分 布 式 事务 协调 器 。 这 个 系统 是 一 个 独立 
的 软件 ， 协 调 所 有 的 事务 ， 并 基于 和 本 地 事务 管理 器 的 交互 做 出 提交 或 放弃 的 决策 。 这 种 方 
法 通常 由 操作 系统 厂商 提供 ， 而 DBMS 厂 商 需 要 开发 和 事务 管理 器 通信 的 接口 。 主 事务 管理 器 
可 以 运行 于 独立 的 系统 ， 或 者 本 地 事务 管理 器 中 的 一 个 也 可 能 提升 为 协调 者 。 

独立 性 是 事务 管理 器 的 主要 优势 。 只 要 各 个 厂商 提供 支持 (利用 本 地 资源 管理 软件 )， 系 
统 就 能 支持 不 同 的 产品 。 对 于 程序 级 别 的 事务 , 就 是 数据 库 之 外 还 有 足够 多 的 代码 (比如 C++) 
事务 ， 它 也 同样 有 用 。 通 过 事务 管理 器 ， 如 果 需 要 ， 数 据 库 系统 可 以 修改 一 一 而 不 需要 重 写 所 
有 的 事务 处 理 元 素 。 
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图 10-9 分 布 式 事务 处 理 监控 器 。 这 个 软件 处 理事 务 决 策 ， 并 通过 和 本 地 事务 
管理 器 的 通信 来 协调 各 参与 系统 


10.4.8 分 布 式 设计 问题 


由 于 存在 传输 代价 、 复 制 和 并 发 这 些 问题 ， 分 布 式 数据 库 需要 仔细 地 进行 设计 。 随 着 网 络 
传输 速率 的 增加 ， 数 据 库 设 计 的 问题 最 终 会 变 少 。 同 时 ， 你 需要 分 析 你 的 应 用 ， 确 定 它们 该 
如 何 分 布 。 图 10-10 列 出 了 一 些 设计 分 布 式 数据 库 时 可 能 遇 到 的 问题 。 关 键 在 于 数据 库 的 哪些 
部 分 应 该 复制 。 如 果 所 有 地 点 的 用 户 都 需要 数据 库 保持 绝对 的 一 致 性 ， 那 么 复制 很 可 能 就 是 
个 坏 主意 。 另 一 方面 ， 你 可 能 有 一 个 对 封锁 和 并 发 处 理 得 不 太 好 的 DBMS 。 这 种 情况 下 ， 最 好 
复制 数据 ， 也 比 冒 着 事务 不 成 功 时 数据 被 破坏 的 风险 要 强 。 


问题 
需要 哪个 级 别 的 数据 一 致 性 ? 
存储 器 有 多 贵 ? 

什么 是 权限 共享 的 需求 ? 

多 长 时 间 更 新 一 次 表 ? 


(事务 ) 要 求 的 更 新 速度 ? 
预测 事务 时 间 有 多 重要 ? 
DBMS 对 并 发 和 封锁 的 支持 ? 
能 否 避 免 访 问 共享 ? 





图 10-10 设计 问题 。 使 用 这 些 问 题 来 确定 应 该 复制 数据 库 还 是 提供 通过 网 络 对 
数据 进行 并 发 访问 。 事 务 操作 通常 需要 和 并 发 访问 配合 运行 。 决 策 支 
持 系统 常常 使 用 复制 的 数据 库 。 但 是 ， 正 确 选 择 取决 于 数据 的 使 用 和 
用 户 需 求 


10.5 客户 /服务 器 数据 库 


当前 ， 在 网 络 上 构建 用 于 分 布 数 据 (和 计算 机 ) 的 系统 时 ， 客 户 /服务 器 方法 最 为 流行 。 
在 这 类 系统 里 ， 将 多 用 户 操作 系统 强大 的 计算 机 作为 服务 器 ， 而 小 一 点 儿 的 计算 机 一 一 通常 为 
个 人 计算 机 一 作为 客户 端 。 服 务 器 装 有 软件 和 用 户 共 享 的 数据 。 客 户 计算 机 只 保留 其 使 用 者 
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的 个 人 数据 。 

客户 /服务 器 方法 的 发 展 很 大 程度 是 由 个 人 计算 机 操作 系统 的 有 限 能 力 所 驱 使 的 。 早 期 的 
操作 系统 不 支持 多 用 户 ， 也 不 提供 安全 保护 。 因 此 ， 给 处 理 所 有 需要 共享 数据 和 硬件 的 服务 
器 安装 上 强大 的 操作 系统 ， 比 起 监控 数 百 台 PC 机 ， 客 户 / 服 务 器 方法 比较 容易 管理 和 控制 。 任 
何 需要 共享 的 硬件 、 软 件 或 数据 都 存放 到 一 个 集中 的 场地 ， 并 由 管理 信息 系统 的 人 员 控制 。 
在 客户 /服务 器 方法 中 ， 要 共享 的 所 有 数据 首先 传送 到 服务 器 上 。 

如 图 10-11 所 示 ， 客 户 /服务 器 数据 库 以 同样 的 方式 运行 。 实 际 的 数据 库 驻 留 在 服务 器 计算 
机 上 。 独 立 的 组 件 可 以 在 客户 机 上 运行 ， 但 它们 在 服务 器 上 存储 和 提取 数据 。 客 户 端 组 件 通常 
是 和 用 户 交互 的 前 端 程序 。 例 如 ， 一 种 常见 的 方法 就 是 把 数据 表 存 放 在 服务 器 上 ， 但 在 个 人 计 
算 机 上 运行 表单 。 表 单 利用 图 形 化 界面 处 理 用 户 事件 ， 但 所 有 的 数据 都 会 传送 到 服务 器 上 。 


服务 器 服务 器 


共享 的 
数据 库 


前 端的 用 户 界面 





客户 端 客户 端 


图 10-11 客户 /服务 器 系统 。 客 户 计算 机 运行 前 端的 用 户 界 面 程序 。 这 些 程序 
在 那些 运行 于 服务 器 计算 机 上 的 共享 的 数据 库 中 存储 和 提取 数据 。 网 
络 使 得 客户 端 可 以 访问 任意 服务 器 上 的 数据 ， 只 要 有 适当 的 权限 


设计 和 管理 客户 /服务 器 数据 库 ， 需 要 理解 一 些 重要 的 概念 。 与 任何 分 布 式 数据 库 一 样 ， 
在 哪里 存放 数据 与 如 何 访 问 可 以 造就 性 能 完全 不 同 的 系统 。 本 节 介 绍 一 些 现 有 的 用 来 创建 客 
户 / 服 务 器 数据 库 应 用 的 工具 。 


10.5.1 客户 /服务 器 与 文件 服务 器 


为 了 理解 客户 /服务 器 数据 库 的 特性 和 强大 之 处 ， 先 来 看 一 个 不 是 真正 客户 /服务 器 数据 库 
的 数据 库 应 用 。 最 初 的 本 地 网 络 是 基于 文件 服务 器 的 。 文 件 服务 器 是 一 个 用 个 人 计算 机 共享 
文件 的 中 央 计 算 机 。 但 是 ， 它 不 含有 数据 库 。 文 件 服务 器 存储 文件 ， 但 对 个 人 计算 机 来 说 ， 
它 更 像 一 个 庞大 的 、 被 动 的 磁盘 驱动 器 。 这 个 服务 器 惟一 的 目标 就 是 提供 对 文件 共享 的 安全 
访问 。 客 户 的 个 人 计算 机 执行 所 有 的 程序 处 理 。 

图 10-12 展 示 了 这 个 基本 的 问题 。 数 据 库 文件 存放 到 文件 服务 器 上 ， 但 DBMS 自 己 却 运 行 
于 客户 端 。 设 置 了 安全 许可 后 ， 每 个 用 户 就 有 了 读 和 写 文件 的 权限 。 当 运行 应 用 时 ， 表 单 和 
你 的 代码 下 载 到 客户 计算 机 上 。 应 用 程序 运行 查询 时 ， 问 题 就 出 现 了 。 查 询 的 处 理 是 在 客户 
端 完成 的 。 这 就 意味 着 那 台 个 人 计算 机 必须 从 服务 器 上 提取 数据 的 每 一 行 ， 再 检查 ， 然 后 决 
定 是 否 在 计算 或 显示 中 使 用 。 如 果 数 据 库 小 ， 网 络 连接 快 ， 而 且 如 果 用 户 常常 希望 看 到 整个 
表 ， 这 种 处 理 就 没什么 。 但 是 ， 如 果 表 很 大 且 用 户 只 需要 看 很 小 一 部 分 数据 ,- 传输 整个 表 到 
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客户 端 就 是 浪费 时 间 和 网 络 带宽 了 。 












| fcustip Name ...[ 
/115 Jenkins .… | 
表单 |1125 Juarez ...| 


| New | 





一 次 传 一 行 数据 ， 
直到 所 有 的 数据 
行 都 检查 完毕 


图 10-12 文件 服务 器 问题 。 文 件 服务 器 扮演 着 一 个 庞大 、 被 动 的 磁盘 驱动 器 角 
色 。 个 人 计算 机 执行 全 部 的 数据 库 处 理 ， 所 以 它 必 须 提取 和 检查 数据 
的 每 一 行 。 对 于 较 大 的 表 ， 这 个 过 程 很 慢 ， 而 且 浪费 网 络 带宽 
问题 就 在 于 当 应 用 仅 需 要 部 分 数据 时 ， 文 件 服 务 器 方法 也 要 传送 大 量 的 数据 。 客 户 /服务 
器 数据 库 方法 就 是 设计 来 解决 这 个 问题 的 。 在 客户 /服务 器 数据 库 中 ， 数 据 库 的 二 进 制 代 码 是 
运行 在 服务 器 上 的 。 如 图 10-13 所 示 ， 服 务 器 数据 库 接收 
SQL 语句 ， 进 行 处 理 ， 然 后 只 返回 查询 结果 。 注 意 它 在 
网 络 传输 上 的 降低 。 初 始 的 SQL 语句 很 小 ， 并 且 只 有 应 
用 所 需 的 数据 才 在 网 络 上 传输 。 这 个 结果 对 于 决策 支持 
系统 尤为 重要 。 服 务 器 数据 库 可 能 包括 几 百 万 行 数据 。 
经 理 正 在 分 析 数 据 并 想 要 些 总 结 性 的 统计 ， 比 如 均值 。 
服务 器 数据 库 对 查询 进行 优化 ， 计 算出 结果 ， 然 后 只 给 
客户 端 传 回 一 些 简 单 的 数字 。 若 没有 服务 器 数据 库 ， 几 
百 万 行 数据 将 可 能 通过 网 络 传输 。 要 牢记 即使 快速 局 域 





文件 服务 器 


网 的 传输 速率 也 比 磁盘 传输 慢 很 多 。 
， 图 10-13 数据 库 服务 器 。 客 户 计算 机 
当然 ， 服 务 器 数据 库 方法 也 有 缺点 ， 即 花 过 多 的 时 发 送 SQL 语 句 ”由 服务 器 进 
间 来 处 理 数据 。 因 此 ;服务器 计算 机 必须 配置 得 可 以 同 行 处 理 。 只 给 客户 端 返 回 结 
时 为 多 个 用 户 有 效 地 执行 数据 处 理 。 幸 运 的 是 ， 处 理 器 果 ， 降 低 网 络 流量 


的 速度 提高 比 磁盘 和 网 络 传输 速度 的 提高 要 快 很 多 。 另 一 个 缺点 是 这 种 方法 需要 购买 一 个 运 
行 在 服务 器 上 的 强大 的 DBMS。 尽 管 如 此 ， 你 几乎 没有 其 他 的 选择 。 只 有 针对 少数 用 户 的 小 型 
应 用 才 可 以 不 用 数据 库 服务 器 而 运行 起 来 。 


10.5.2 .三 层 客户 /服务 器 模型 


三 层 客户 /服务 器 模型 的 方法 已 经 被 认为 比 两 层 模型 有 很 多 优势 。 三 层 方 法 在 客户 端 和 服 
务 器 之 间 加 了 一 层 。 三 层 方法 在 使 用 若干 个 数据 库 并 涉及 多 个 应 用 的 系统 里 尤其 有 效 。 这 种 
方法 在 一 些 服务 器 运行 遗留 的 应 用 时 也 比较 有 用 。 
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如 图 10-14 所 示 ， 中 间 层 的 角色 之 一 就 是 创建 到 数据 库 的 连接 。 如 果 需 要 ， 中 间 层 翻译 
SQL 请 求 ， 并 从 遗留 的 COBOL 程 序 中 提取 数据 。 通 过 在 某 地 放置 访问 链接 ， 就 可 以 在 不 影响 
客户 前 端 程序 的 情况 下 移动 或 修改 服务 器 数据 库 。 开 发 者 们 只 需要 简单 地 改变 场地 指针 ， 或 
者 修改 中 间 件 的 路 由 。 一 些 人 也 把 这 种 方法 称 作 n 层 方法 ， 因 为 可 以 有 多 台中 间 级 的 计算 机 ， 
每 台 都 确定 商业 规则 中 的 一 个 方面 。 


应 用 程序 前 端 
用 户 接口 





图 10: 地 三 晨 客户 /服务 器 模型 。 中 间 层 把 数据 库 和 应 用 里 的 商业 规则 和 程序 代 
码 分 离开 来 。 这 种 独立 性 可 以 很 容易 修改 每 个 组 件 而 不 影响 其 他 元 素 
中 间 层 的 另 一 个 重要 角色 就 是 维护 商业 规则 。 例 如 ， 为 顾客 和 产品 创建 标识 应 该 遵从 统一 
的 过 程 。 生 成 这 些 数字 的 例 程 应 该 存放 在 一 个 场地 ， 然 后 所 有 需要 它 的 应 用 都 调用 那个 函数 。 
类 似 地 ， 常 见 的 应 用 函数 也 可 以 只 写 一 遍 ， 并 存放 在 中 间 层 服务 器 上 。 
这 种 中 间 件 系统 和 面向 对 象 的 开发 方法 配合 得 很 好 。 用 于 多 个 商业 应 用 的 通用 对 象 可 以 只 
写 一 次 ， 然 后 存放 在 中 间 服 务 器 上 。 任 何 应 用 都 可 以 按 需 使 用 那些 对 象 。 随 着 商业 规则 的 变 
化 或 系统 的 更 新 ， 开 发 者 可 以 在 不 影响 客户 端 应 用 操作 的 情况 下 ， 修 改 或 更 新 基 类 对 象 。 三 
层 方法 分 离 了 数据 库 和 应 用 中 的 商业 规则 及 程序 代码 。 这 种 独立 性 让 系统 更 加 灵活 ， 也 更 容 
易 扩展 。 近 期 一 些 编程 工具 ， 比 如 VB 的 企业 版 ， 推 动 了 中 间 层 的 开发 。 可 以 用 Visual Basic 创 
建 中 间 层 对 象 。 它 可 以 从 任何 服务 器 上 提取 数据 ， 或 者 简单 地 执行 计算 。 可 以 创建 不 以 任何 
形式 运行 的 作为 动态 链接 库 (DLL) 的 组 件 。 把 它 安装 在 中 间 层 的 计算 机 上 ， 然 后 建立 客户 
端 应 用 。 有 了 VB 的 企业 版 ， 你 的 应 用 就 可 以 打开 和 使 用 任何 与 之 相连 的 计算 机 上 的 组 件 
了 一 一 只 要 设 定 了 合适 的 权限 。 可 以 配置 分 布 式 的 COM (DCOM) 来 建立 访问 权限 。 


10.5.3 后 端 : 服务 器 数据 库 


很 多 公司 都 有 服务 器 数据 库 ， 而 各 种 产品 都 有 其 特定 的 优 缺点 。 有 些 必须 运行 在 某 种 品牌 
的 计算 机 凸 ， 其 他 可 以 运行 在 不 同 的 机 器 上 。 幸运 的 是 ,大 部 分 主流 的 DBMS 厂 商都 支持 SQL。 
因此 ， 定 义 数据 库 并 构造 查询 可 以 按 你 所 知 的 步骤 进行 。 当 然 ， 数据库 厂商 也 添加 了 一 些 需 
要 学 习 的 新 特性 。 

服务 器 数据 库 系统 趋向 于 变 得 更 加 复杂 ， 且 比 基 于 个 人 计算 机 的 系统 需要 更 多 的 管理 任 
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务 。 服 务 器 环境 同时 提供 了 更 多 的 选项 ， 让 管理 和 开发 也 更 加 复杂 起 来 。 服 务 器 计算 机 使 用 
更 为 强大 的 操作 系统 来 支持 多 个 用 户 。DBA 必 须 和 系统 管理 员 紧 密 配 合 ， 安 装 软件 ， 定 义 用 
户 账户 以 及 监控 性 能 。 ， 

服务 器 数据 库 同时 使 用 触发 器 过 程 来 定义 和 确保 商业 规则 。 一 个 更 难 的 设计 问题 是 ， 必 须 
决定 在 哪里 存储 商业 规则 : 是 作为 数据 库 触发 器 和 过 程 存储 在 后 端 数据 库 中 ， 还 是 使 用 像 C++ 
或 Visual Basic 这 样 的 低级 语言 把 它们 移 到 中 间 级 服务 器 上 。 有 时 候 你 会 受到 可 用 工具 和 时 间 
的 限制 。 但 只 要 有 可 能 ， 应 该 依据 费用 、 性 能 和 可 扩展 性 考虑 各 种 可 行 方案 。 

把 过 程 放 到 后 端 数据 库 保证 了 不 论 数 据 如 何 访 问 , 所 有 的 规则 都 由 DBMS 强 制 执行 。 但 是 ， 
这 种 方法 就 把 你 栓 在 一 个 特定 的 DBMS 厂 商 上 了 。 因 为 绝 大 部 分 系统 都 有 一 些 非 标准 的 元 素 ， 
以 后 想 转换 到 别 的 DBMS 上 就 难 了 .把 规则 放 到 中 间 层 也 使 得 物理 地 转移 数据 库 变 得 更 加 简单 。 
通常 ， 系 统 都 是 使 用 数据 库 连接 而 建立 起 来 的 。 要 转移 数据 库 ， 只 需要 简单 地 改变 引用 指针 。 

有 一 个 经 验方 法 ， 就 是 为 客户 计算 机 编写 用 户 界面 代码 ， 同 时 编写 运行 在 服务 器 上 的 数据 
操作 和 控制 程序 。 用 中 间 层 程序 来 实现 商业 规则 ， 并 提供 数据 转换 和 数据 库 独 立 性 。 其 主要 
目标 就 是 最 小 化 数据 在 网 络 上 的 传输 。 尽 管 如 此 ， 如 果 一 些 计 算 机 比 其 他 的 慢 得 多 ， 为 了 在 
快 点 儿 的 计算 机 上 执行 代码 ， 还 需要 接受 更 多 的 数据 传输 。 


10.5.4 前端: Windows 客 户 端 


基于 Windows 的 计算 机 通常 都 用 作客 户 机 ， 所 以 微软 已 经 开发 了 若干 种 技术 ， 以 提供 从 
PC 机 到 后 端 数据 库 的 连接 。 许 多 不 同 的 工具 和 厂商 都 支持 这 些 技 术 ， 所 以 它们 也 是 相对 标准 
化 的 。 随 着 硬件 和 网 络 的 提升 ， 应 用 变 得 越 来 越 复杂 ， 这 些 工 具 也 在 发 展 。Visual Basic 常 常 
用 作 前 端 工具 创建 表单 和 报表 。 程 序 经 过 编译 ， 分 布 到 各 用 户 计算 机 上 ， 可 以 通过 微软 的 数 
据 组 件 连接 到 后 台 服 务 器 上 。PC 都 有 一 个 网 
络 连接 和 数据 库 连 接 ， 使 得 它们 可 以 找到 服 
务 器 上 的 中 央 数 据 库 。VB 程 序 代码 只 是 简单 
地 选择 合适 的 数据 库 连接 。 从 这 点 上 说 ， 应 
用 已 经 不 再 关心 数据 在 哪里 存放 了 一 一 只 需 把 
SQL 请 求 传 给 服务 器 就 行 了 。 

开放 式 数 据 库 互 连 (ODBC) 是 微软 早期 
的 用 于 连接 Windows 客 户 端 到 服务 器 的 技术 。 
一 些 系统 仍然 利用 这 个 技术 ， 但 它 相 对 较 慢 。 
更 新 的 技术 是 活动 数据 对 旬 (ADO)， 由 于 使 
用 较 少 的 层 ， 它 更 加 快速 ， 也 提供 更 多 的 功 
能 。 最 新 的 版 本 是 ADO.NET， 含 有 针对 微 
软 .NET 环 境 的 一 些 额外 功能 。 

ADO 运 行 在 各 厂商 网 络 系统 的 顶层 ， 因 ”图 10-15 活动 数据 对 象 连接 。 在 分 布 式 环境 中 ， 








此 它 提供 对 数据 更 直接 的 访问 。ADO 可 以 利 ADO 处 理应 用 程序 和 基本 数据 传输 层 之 
用 ODBC 来 处 理 文件 ， 也 可 用 于 那些 没 提 供 自 间 的 连接 。 最 快 的 方法 就 是 使 用 DBMS 厂 
| 一 商 的 数据 传输 工具 ， 但 是 没有 其 他 可 用 机 


己 数据 传输 方案 的 系统 。 图 10-15 展 示 了 ADO 制 时 也 可 以 使 用 开放 式 数 据 库 连接 ODBC 
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在 分 布 式 环境 下 的 使 用 。 需 要 安装 数据 库 厂商 的 数据 传输 层 。 然 后 ， 应 用 选择 合适 的 ADO 驱 
动 ， 连 接 基本 的 数据 库 传输 服务 。ADO 把 SQL 语 句 传递 给 传输 服务 ， 并 对 返回 数据 进行 基本 
的 数据 传输 处 理 (例如 识别 日 期 、 整 型 和 金融 数据 )， 同 时 一 致 地 处 理 数 据 游标 。 因 此 ， 用 
ADO 工 具 编 写 的 应 用 可 以 访问 不 同 的 数据 库 。 


10.5.5 在 客户 端 维护 数据 库 的 独立 性 


分 布 式 数据 库 最 麻烦 的 地 方 就 是 维护 数据 库 的 独立 性 了 。 当 初次 建立 应 用 时 ， 它 常常 与 后 
端的 单一 的 、 特 定 的 数据 库 共 同 运行 。 因 此 ， 很 容易 假设 那里 一 直 就 只 有 那个 数据 库 ， 并 且 
使 用 那个 特定 系统 内 可 用 的 工具 和 快捷 键 。 但 以 后 若 有 人 要 改变 后 端 数据 库 时 该 如 何 办 ? 极 
端 情况 下 ， 整 个 应 用 都 要 重 写 。 作 为 一 个 不 成 熟 的 开发 者 ， 你 可 能 会 问 为 什么 。 考 虑 一 下 如 
果 有 人 想 在 以 后 改变 数据 库 ， 他 们 是 否 愿意 在 那 时 还 支付 费用 ? 不 过 ， 预 先 只 需要 很 少 一 些 
额外 付出 ， 应 用 就 可 以 支持 大 多 数 后 端 常见 的 数据 库 ， 这 使 以 后 的 更 新 变 得 容易 。 

数据 库 连 接 是 构建 通用 程序 的 一 个 问题 。 使 用 ADO 或 ODBC 这 种 通用 的 标准 使 得 改变 数据 
库 更 加 容易 。 图 10-16 展 示 了 通过 改变 连接 ， 应 用 可 以 连接 到 不 同 的 DBMS。 当 然 ， 绝 不 是 那 
么 简单 ， 但 ADO 缓 存 是 个 重要 元 素 。 在 很 多 情况 下 ， 你 可 以 动态 指定 ADO 连 接 串 ， 以 方便 应 
用 程序 在 不 重 写 代 码 的 情况 下 连接 不 同 的 DBMS。 如 果 比 较 仔 细 ， 可 以 创建 一 个 应 用 ， 让 它 能 
够 在 任何 时 候 切 换 DBMS 连 接 。 可 以 使 用 一 个 DBMS 构 建 系 统 ， 然 后 让 产品 系统 运行 在 另 一 个 
不 同 的 DBMS 上 。 


原来 的 DBMS 新 的 DBMS 





图 10-16 数据 库 独 立 性 。ADO 是 应 用 程序 和 DBMS 之 间 一 个 有 用 的 缓存 。 改变 
连接 可 以 让 切换 后 端 DBBMS 变 得 相对 简单 些 
在 构造 一 个 与 DBMS 无 关 的 应 用 时 ， 很 重要 的 一 点 就 是 理解 连接 是 惟一 的 因素 。 大 多 数 情 
况 下 ， 实 际 的 SQL 命令 是 个 更 大 的 问题 。DBMS 厂 商都 提供 对 SQL 标准 的 不 同 级 别 的 支持 。 它 
们 也 私自 增加 了 一 些 诱 人 的 命令 选项 。 特 别 地 ,厂商 在 SELECT 语句 中 提供 了 很 多 变化 。 例 如 ， 
字符 串 和 日 期 操作 在 不 同 的 厂商 之 间 严 重地 不 统一 。 并 且 ， 如 果 使 用 老 版 本 的 Oracle 和 SQL 
Server， 就 不 能 使 用 INNER JOIN 语 法 。 由 于 这 些 差别 ， 让 应 用 独立 于 DBMS 的 关键 一 步 乃 是 
把 所 有 对 DBMS 的 查询 都 存 为 视图 。 然 后 应 用 只 包含 从 保存 的 视图 中 提取 数据 的 简单 SELECT 
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(或 者 INSERT/UPDATE/DELETE) 查询 。 这 些 简单 的 查询 应 该 只 使 用 基本 的 标准 SQL 元 素 。 
所 有 与 厂商 相关 的 功能 都 编码 成 为 DBMS 内 部 的 查询 。 要 转换 到 新 的 DBMS ， 只 需要 在 新 的 
DBMS 上 使 用 厂商 指定 的 工具 和 语法 重新 创建 查询 。 这 种 技术 对 那些 开始 较 小 然后 慢 慢 增长 的 
应 用 尤为 重要 。 规 模 较 小 时 ， 可 以 使 用 小 型 的 、 便 宜 的 DBMS， 但 随 着 用 户 数 的 增加 和 系统 需 
求 的 增长 ， 需 要 按 比例 使 用 大 一 些 的 DBMS。 如 果 细 心 建立 应 用 查询 来 保持 独立 性 ， 转 换 到 新 
的 DBMS 就 简单 多 了 。 图 10-17 展 示 了 一 个 使 用 简单 查询 来 维护 DBMS 广 商 独 立 性 的 例子 。 


Generic application query: 
SLECT SaleID, SaleDate, CustomerID, CustomerName 
FROM SaleCustomer 


Saved Oracle query: 
SELECT SaleID， SaleDate, CustomerID， 
LastName | 人 ,| | FirstName AS CustomerName 
From Sale, Customer 
WHERE Sale.CustomerID=Customer .CustomerID 


Saved SQOL Server query: 
SELECT SaielID, SaleDate, CustomerID, 


_ LastName 十 ，' 十 FirstName AS CustomerName 
FROM Sale INNER JOIN Customer 
ON Sale.CustomerID = Customner .CuStomerID 





图 10-17 数据 库 查询 独立 性 。 应 用 只 包含 了 不 使 用 厂商 相关 功能 的 简单 查询 。 
所 有 详细 的 查询 都 在 DBMS 内 部 创建 和 保存 


触发 器 功能 是 个 更 为 复杂 的 问题 。 一 些 系统 根本 就 不 支持 触发 器 ， 而 那些 支持 触发 器 的 系 
统 提 供 的 通常 也 是 各 不 相同 的 功能 。 从 这 点 上 讲 ， 当 前 要 保证 跨 厂 商 兼 容 性 的 惟一 方法 就 是 
避免 使 用 数据 库 触发 器 。 取 而 代 之 ， 应 该 把 相同 的 功能 写 到 同样 依赖 通用 查询 的 中 间 件 代码 
中 去 。 


10.6 电子 商务 数据 库 


在 许多 方面 ， 电 子 商务 同 传统 的 数据 库 应 用 很 相似 。 其 不 同 点 来 自 一 些 额 外 的 数据 和 可 用 
性 问题 。 当 用 户 在 Web 上 输入 数据 时 ， 因特网 把 你 需要 维护 的 重要 信息 传送 到 服务 器 上 。 例如 ， 
你 可 以 保存 客户 的 也 地 址 、 任 何 把 客户 导向 到 你 的 站 点 的 源 页 面 或 广告 页 面 以 及 支付 信息 和 确 
认 数 据 。 

Web 的 本 质 就 是 让 用 户 作出 选择 ， 把 他 们 自己 的 数据 输入 到 你 的 表单 中 。 因 此 ， 这 些 表单 
必须 易于 使 用 。 这 种 情况 下 ， 标 准 化 就 是 简易 使 用 的 重要 方面 。 随 着 时 间 的 流逝 ， 网 站 为 处 
理 基 本 任务 已 经 开发 出 了 标准 的 格式 。 你 的 应 用 需要 追随 这 些 基 本 格式 ， 这 样 用 户 也 就 可 以 
面 对 熟 悉 的 任务 。 

今天 ， 电 子 商 务 网 站 通常 包含 一 个 带 有 价格 、 描 述 和 图 片 的 产品 的 数据 库 。 你 的 应 用 必须 
显示 商品 项 的 描述 ， 还 必须 提供 帮助 顾客 找到 特定 商品 的 搜索 引擎 。 你 同样 需要 一 个 购物 车 ， 
它 包含 用 户 临时 选中 的 商品 列表 。 购 物 车 通常 开发 为 一 个 基本 表 ， 它 保存 着 每 个 客户 的 商品 
项 列表 。 你 的 应 用 还 需要 有 一 个 检验 页 面 ， 使 得 用 户 可 以 对 购物 车 里 的 商品 项 进行 最 终 的 更 
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新 ， 收 集 付 款 和 送 货 信息 ， 然 后 记录 这 个 订单 。 另 外 ， 还 需要 让 用 户 以 后 再 回来 ， 并 查看 他 
们 订单 的 状态 。 

在 所 有 这 些 用 户 界面 元 素 上 面 , 网 站 还 需要 若干 个 管理 页 面 。 公 司 里 的 某 人 需要 更 新 描述 、 
图 片 和 价格 。 其 他 员工 需要 检查 订单 ， 输 入 送 货 日 期 数据 ， 并 解决 基本 的 订单 问题 。 市 场 部 
希望 能 监控 销售 情况 ， 评 估 广 告 效 益 ， 并 检查 客户 属性 。 所 有 这 些 管 理 任务 都 需要 额外 的 表 
单 。 并 不 是 从 零 开 始 编写 一 个 新 的 Web 应 用 ， 事 实 上 ， 很 多 公司 都 选择 购买 标准 的 商业 软件 系 
统 来 得 到 所 有 这 些 需 要 的 特性 。 但 对 其 他 很 多 公司 来 说 ， 编 写 客户 数据 库 应 用 还 是 很 必要 的 。 

由 于 因特网 的 快速 发 展 壮 大 ， 各 种 工具 仍 在 开发 中 。 后 端 数据 库 的 概念 和 前 面 章节 讨论 过 
的 类 似 。 尽 管 如 此 ， 前 端的 表单 和 报表 都 是 作为 需要 连接 数据 库 的 Web 页 面 开发 的 。 支 持 更 容 
易 地 创建 这 些 页 面 的 一 些 工具 也 正在 开发 中 。 例 如 ， 微 软 有 .NET 家 族 的 ASP; IBM 有 
WebSphere 产 品 ，Oracle 销 售 OracleWeb 工 具 ， 还 有 Sun 公 司 ， 正 在 让 它 的 Java 和 Java 数 据 库 连 
接 (JDBC) 走向 市 场 。 在 一 本 书 里 覆盖 所 有 这 些 技术 是 不 可 能 的 ， 更 别 说 一 章 了 。 所 以 本 章 
只 讨论 一 些 通用 的 概念 ， 和 一 些 基于 Web 的 分 布 式 数据 库 应 用 的 特殊 问题 。 


10.7 ”作为 客户 /服务 器 系统 的 Web 


万 维 网 (WWW) 原来 设计 为 客户 /服务 器 系统 。 其 目标 是 让 和 人们 (物理 学 家 和 科研 工作 
者 ) 可 以 在 他 们 的 学 院内 共享 信息 。 最 根本 的 问题 在 于 每 个 人 都 使 用 不 同 的 硬件 和 软件 一 一 不 
管 是 客户 端 还 是 服务 器 一 一 所 以 解决 方案 就 是 定义 一 系列 的 标准 。 这 些 发 展 来 的 标准 是 Web 的 
核心 。 它 们 定义 了 计算 机 如 何 连接 、 数 据 如 何 传输 以 及 如 何 寻 找 数据 。 一 些 附加 的 标准 定义 
了 数据 应 该 如 何 存 储 及 显示 。 客 户 端 运行 用 于 接收 和 显示 数据 文件 的 浏览 器 软件 。 服 务 器 运 
行 响应 请 求 、 找 到 合适 文件 并 发 送 所 需 数 据 的 Web 服 务 器 软件 。 客 户 端 和 浏览 器 都 在 逐渐 变 得 
复杂 起 来 ， 但 图 10-18 展 示 了 这 种 方法 的 本 质 。 





信息 
因特网 









Web 服 务 器 


HTML 页 面 


http://server. location/page 


图 10-18 Web 服 务 器 和 客户 端 浏览 器 。 浏 览 器 是 标准 化 的 显示 平台 。 可 以 从 任 
何 浏览 器 访问 服务 器 


10.7.1 受 限 的 HTML 客 户 端 


今天 ，Web 服 务 器 可 以 绑 定 到 数据 库 上 。 数 据 库 能 够 维护 传统 数据 ， 或 者 维护 从 浏览 器 接收 
到 的 复杂 图 形 和 其 他 对 象 。 要 在 这 个 环境 下 建立 应 用 ， 必 须 理解 和 遵循 浏览 器 显示 数据 的 规则 。 
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这 个 基本 的 浏览 器 规则 就 是 只 知道 如 何 显示 特定 类 型 的 数据 ， 诸 如 文本 和 图 形 。 每 种 数据 
类 型 都 必须 用 一 种 预定 义 的 格式 创建 。 大 多 数 情况 下 ， 不 允许 创建 数据 的 新 格式 和 新 类 型 。 
浏览 器 的 能 力 一 直 在 扩展 ， 以 便 处 理 新 的 数据 类 型 ， 比 如 声音 和 视频 。 但 是 ， 应 用 程序 和 数 
据 库 必须 遵循 新 数据 类 型 的 标准 。 同 时 ， 不 同 浏览 器 显示 信息 的 方式 有 很 多 种 。 如 果 希 望 更 
多 的 处 于 不 同 环境 的 人 都 可 以 访问 你 的 数据 ， 就 必须 仔细 地 避免 不 兼容 问题 。 

超 文本 标记 语言 (HTML) 是 浏览 器 显示 系统 的 基础 。 它 是 一 个 简化 的 页 面 描述 语言 。 为 
了 最 大 程度 的 兼容 性 ， 所 有 发 送 到 浏览 器 的 信息 都 应 该 送 到 HTML 页面。 在 因特网 上 有 很 多 学 
习 HTML 的 资源 ， 并 且 有 很 多 教程 手册 来 帮 你 学 习 这 门 语言 。 最 基本 的 ， 就 是 用 标签 来 控制 页 
面 布局 和 文本 属性 。 标 签 是 用 尖 括 号 括 起 来 的 简短 词语 ， 如 <B>。HTML 使 用 标签 对 ， 例 如 ， 
要 让 一 个 单词 成 为 黑体 , 可 以 用 一 个 开始 标签 和 一 个 结束 标签 包 住 它 , 比如 <B> 我 的 文本 </B>。 
一 个 简单 的 HTML 范 例 在 图 10-19 显 示 ， 其 输出 见 图 10-20。 


<HTML> 

<HEAD> 

<TITLE>My main page</TITLE></HEAD> 

<BODY BACKGROUND="“graphics/backd0 .jpg’”> 

<P>My text goes in paragraphs.</P> 

<P>Additional tags Set <B>boldface</B> and 
<I>Italic</I> 

<P>Tables are more complicated and use a set of tags for 
rows and columns.</P> 

<TABLE BORDER=1> 

<TR><TD>First cell</TD><TD>Second cell</TD></TR> 
<TR><TD>Next row</TD><TD>Second column</TD>></TR> 
</TABLE> 

<P>There are form tags to create input forms for 
collecting data. 

But you need CGI program code to convert and use the 
input data</P> 

</BODY> 

</HTML> 





图 10-19 典型 的 HTML 页 面 。 标 签 设置 页 面 布局 ， 控 制 文本 格式 。 数 据 库 应 用 
常常 使 用 标签 来 创建 表格 以 显示 结果 。 表 单 标签 用 于 收集 和 服务 器 交 
互 所 需 的 数据 


My text goes in paragraphs. 

Additional tags set boldface and ltalic. 

Tables are more complicated and use a set of tags 
for rows and columns. 


First celi Second cell 


Next row | Second column 


There are form tags to create input forms for 
collecting data. But you need CCt program code 
to convert and use the input data. 





图 10-20 HTML 页 面 显 示 
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数据 库 应 用 常常 使 用 两 个 特定 的 标签 集 : 一 个 创建 表 ， 另 一 个 创建 表单 。 表 显示 数据 库 的 
输出 ， 而 表单 为 数据 库 收 集 数 据 ， 并 从 用 户 处 获得 构建 查询 的 参数 。 如 果 希 望 构建 在 Web 上 的 
数据 库 应 用 ， 应 该 多 学 学 这 些 基本 的 标签 。 幸 和 运 的 是 ， 有 不 少 工具 可 以 帮 你 自动 创建 HTML 页 
面 ， 所 以 你 不 需 记 住 HIML 语 法 。 当 今 大 多 数 文字 处 理 软件 都 可 以 存储 诸如 HTML 格 式 的 输入 
表单 这 样 的 文档 。 

图 形 的 限制 更 多 一 点 儿 。 需 要 把 图 像 存 成 下 列 3 种 格式 之 一 : GIF，JPEG 或 PNG。 现 代 的 
图 形 软 件 可 以 处 理 这 种 转换 。 由 于 在 显示 图 形 和 数据 方面 的 限制 ， 在 开发 Web 上 的 应 用 时 ， 你 
需要 与 图 形 设计 者 协商 。 

超 文 本 链接 是 Web 的 一 个 重要 特征 。 每 个 页 面包 含 到 其 他 页 面 的 引用 或 链接 。 链 接 的 基本 
格式 是 使 用 锚 标 签 (<A>)。 例 如 : <A HREF=”newfile.html”> 要 显示 的 文本 </A>。 典 型 静 
态 页 面 有 着 固定 的 链接 ， 这 样 每 个 人 都 看 到 了 完全 一 样 的 页 面 和 链接 。 数 据 库 使 开发 者 可 以 
创建 更 为 交互 的 页 面 和 链接 。 链 接 (和 文本 ) 可 以 存放 到 数据 库 的 表 里 。 基 于 用 户 的 动作 ， 
应 用 可 以 从 表 中 提取 所 需 的 数据 ， 并 且 针 对 任意 情况 都 能 构建 出 含 链接 的 页 面 。 一 个 常见 的 
例子 就 是 订购 表单 。 用 户 选 择 一 个 类 别 ， 应 用 就 提取 那个 类 别 的 商品 列表 。 除 了 显示 列表 ， 
每 件 商品 都 链接 到 一 个 描述 页 面 和 一 张 图 片 。 想 看 更 多 信息 的 用 户 可 以 点 击 那 个 链接 。 关 键 
是 类 别 和 链接 信息 都 存放 在 数据 库 里 ， 这 使 得 检索 列表 变 得 很 容易 ， 产 品 经 理 也 能 轻易 地 进 
行 更 新 。 应 用 只 需 简单 地 提取 数据 并 用 <A> 标 签 把 它 格式 化 就 行 了 。 

浏览 器 的 兼容 性 和 标准 都 在 持续 地 快速 发 展 中 。 浏 览 器 现在 支持 你 可 以 用 来 创建 应 用 的 对 
象 。 浏 览 器 记录 用 户 事件 ， 让 你 可 以 为 这 些 事件 绑 定 代码 ， 这 很 像 一 个 数据 库 表 单 。 这 种 客 
户 端的 代码 可 以 记录 用 户 的 选择 ， 操 纵 显示 以 及 与 服务 器 交互 。 类 似 地 ， 服 务 器 端 代 码 可 以 
从 数据 库 里 提取 数据 ， 跟 踪 用 户 连 接 以 及 维护 事务 的 完整 性 。 当 和 服务 器 端 DBMS 联 合 时 ， 
Web 就 可 以 用 来 创建 客户 机 /服务 器 应 用 。 使 用 Web 的 主要 优势 在 于 用 户 可 以 从 世界 上 任何 地 
方 、 使 用 不 同类 型 的 客户 计算 机 来 访问 应 用 。 
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连接 数据 库 到 Web 服 务 器 上 没有 标准 的 机 制 。 因 此 ， 使 用 的 方法 取决 于 你 所 安装 的 特定 软 
件 《Web 服务 器 和 DBMS)。 大 多 数 方法 都 遵循 类 似 的 结构 ， 但 在 细节 方面 有 所 不 同 。 有 些 现 
成 的 工具 可 以 帮 你 用 图 形 化 的 设计 工具 (支持 用 某 种 程序 设计 语言 处 理 数据 ) 来 构建 表单 。 
然后 这 些 工 具 会 生成 发 送 到 客户 端 浏 览 器 的 原始 HTML 文 件 。 选 择 工具 时 要 注意 的 是 其 中 一 些 
工具 需要 用 户 为 浏览 器 下 载 特殊 的 插件 。 大 多 数 用 户 对 于 下 载 非 标准 的 组 件 都 很 警惕 。 当 你 
和 总 公司 以 外 的 其 他 用 户 打交道 时 ， 最 好 坚持 只 用 那些 使 用 标准 浏览 器 特性 的 工具 。 

图 10-21 展 示 了 连接 DBMS 到 Web 服 务 器 的 基本 过 程 。 里 面 的 数字 指示 了 要 发 生 的 3 个 基 
本 步骤 。 记 得 这 些 步 允 有 两 个 方面 : 客户 端 和 服务 器 端 。(0) 首先 需要 创建 表单 ， 这 是 客 
户 端 所 要 求 的 。(1) 然后 用 户 接收 到 表单 并 输入 数据 。 这 些 数据 可 能 为 某 个 查询 条 件 包 含 
了 某 些 值 的 限制 。 例 如 ， 用 户 可 能 会 选择 动物 的 类 别 和 颜色 。(2) 这 个 数据 会 以 通用 网 关 
接口 (CGI) 串 的 形式 传 回 Web 服 务 器 。CGI 指 定 了 在 计算 机 之 间 传 输 数据 的 格式 。 这 些 数 
据 同样 告诉 Web 服 务 器 该 打开 和 传送 数据 到 哪个 文件 。(3) 一 个 新 的 页 面 构造 出 来 并 传 回 给 
用 户 。 


320 箱 四 部 分 ”数据库 营 理 





@ 请 求 服 务 器 /Form.html 





Form.html 
程序 代码 


图 10-21 Web 服 务 器 数据 库 基础 。 开 发 者 构建 初始 表单 、 查 询 和 显示 结果 的 模 
板 。Web 服 务 器 把 这 些 输入 数据 和 查询 合并 ， 然 后 传 给 DBMS (SQL 
Server) 。 查 询 结果 合并 到 模板 ， 并 作为 一 个 新 页 面 发 回 给 用 户 


客户 病 亡 面 

在 客户 端 浏 览 器 上 用 户 将 看 到 如 图 10-22 所 示 表 单 的 简单 序列 。 一 旦 有 人 选择 了 Search 选 
项 ， 那 个 Animal-Search 表 单 就 会 显示 在 浏览 器 上 。 用 户 选择 一 个 类 别 并 输入 一 种 颜色 。 当 点 
击 搜索 按钮 以 后 ， 其 选择 就 发 送 到 服务 器 上 一 个 新 的 页 面 。 这 个 页 面 提取 数据 并 再 格式 化 成 
一 个 新 页 面 。 这 些 数据 通常 存放 在 表 中 ， 类 似 于 图 10-22 所 示 。 用 户 不 需要 知道 关于 DBMS 的 
任何 事 : 用 户 只 是 看 到 表单 和 新 页 面 。 每 个 新 页 面 应 该 提供 额外 的 选择 和 到 其 他 页 面 的 链接 。 
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图 10-22 客户 端 方面 。 客 户 端 在 表单 里 输入 数据 。 点 击 搜索 按钮 把 数据 发 送 到 
服务 器 页 面 。 服 务 器 页 面 从 DBMS 里 提取 匹配 的 数据 并 格式 化 成 一 个 
新 的 HTML 页 面 。 这 个 表 返 回 给 用 户 ， 还 附 有 一 些 额 外 的 选项 
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服务 器 方面 

厂商 们 忙于 创建 和 改良 构建 基于 Web 表 单 的 工具 ， 可 以 更 容易 地 同 数据 库 交 互 。 选 择 的 工 
有 具 不 同 ， 其 细节 差异 丐 大。 尽管 如 此 ， 基 本 过 程 都 是 相似 的 。 服 务 器 从 客户 表单 里 得 到 数据 ， 
按 你 指定 的 规则 进行 验证 ， 然 后 书写 SQL 查询 来 插入 它们 ， 或 更 新 数据 库 中 的 现 有 行 。 复 习 第 
6 章 关于 构造 表单 和 报表 时 涉及 的 所 有 问题 。 它 与 Web 之 间 的 主要 差异 就 是 ， 今 天 的 工具 通常 
需要 更 多 的 编程 技巧 ， 也 需要 具体 情况 具体 对 待 。 另 一 方面 ， 基 于 Web 的 应 用 也 引起 了 一 些 必 
须 解 决 的 潜在 难题 。 数 据 传输 、 并 发 和 服务 器 负荷 都 是 基于 Web 应 用 的 关键 问题 。 事 实 上 ， 在 
厂商 工具 的 重要 差异 之 中 ， 也 有 一 些 能 从 它们 解决 问题 的 方式 中 找到 。 


10.8 应 用 中 的 数据 传输 问题 


乍 一 看 ， 构 建 一 个 客户 端 /服务 器 应 用 好 像 很 简单 。 只 是 简单 地 把 数据 库 移 到 中 央 服 务 器 
上 ， 并 使 用 网 络 连接 来 处 理 数据 传输 。 但 是 ， 客 户 端 /服务 器 应 用 可 能 在 数据 传输 和 表单 可 用 
性 方面 有 一 些 颇 有 具 挑 战 性 的 问题 。 最 难 的 一 个 问题 就 是 表单 里 组 合 框 和 选择 框 的 使 用 。 

考虑 图 10-23 展 示 的 一 个 标准 订购 表单 的 主要 部 分 。 如 果 用 Access 或 Visual Basic 构 建 这 个 
表单 ， 并 在 本 地 一 个 快速 网 络 上 运行 ， 它 会 表现 得 很 好 。 但 如 果 表 单 运行 在 一 个 远程 地 点 ， 
靠 50 千 位 每 秒 的 慢 速 网 络 连 接着 ， 并 且 有 10 000 个 用 户 时 ， 又 会 如 何 ? 简化 起 见 ， 假 设 每 位 客 
户 的 名 字 和 标识 平均 有 20 个 字符 。 所 以 选择 框 需要 20 的 10 000 倍 ， 或 说 200 000 字 节 的 数据 。 
一 个 字 节 是 8 位 ， 为 选择 框 传输 数据 需要 32 秒 的 时 间 。 任 何 时 候 你 刷新 表单 或 重新 加 载 组合 框 
时 ， 又 得 再 花 32 秒 。 如 果 你 的 表单 有 若干 个 选择 框 ， 表 单 加 载 的 时 间 就 会 更 长 。 如 果 表 单 加 
载 超过 若干 秒 ， 大 多 数 用 户 都 会 对 性 能 产生 不 满 。 


mm 
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图 10-23 表单 里 的 数据 传输 。 如 果 有 10 000 个 客户 时 会 如 何 ” 加 载 选择 框 要 花 
多 长 时 间 ? 刷新 含有 多 个 选择 框 的 页 面 需要 花 多 长 时 间 ? 用 户 可 能 如 
何 阅读 并 滚动 这 10 000 个 条 目 呢 ? 
那么 ， 为 什么 不 干脆 移 去 组 合 框 呢 ? 要 理解 这 个 问题 ， 需 要 记得 为 什么 选择 框 很 有 用 。 在 
关系 数据 库 里 ， 数 据 存 放 在 一 些 独 立 的 表 中 ， 而 这 些 表 是 通过 码 数据 连接 的 。 这 个 例子 里 ， 
Order 表 包含 了 CustomerID 。 理 论 上 ， 实 现 一 次 订购 简单 到 只 需 客户 的 ID (最 终 你 还 会 需要 商 
品 个 体 的 标识 数 )。 你 不 能 期 望 你 的 客户 或 办 事 员 记 住 ID 号 ， 所 以 订购 表单 使 用 组 合 框 来 按 字 
母 序列 出 客户 ， 并 为 选中 的 客户 返回 对 应 的 ID 号 。 如 果 移 去 了 组 合 框 ， 就 需要 重新 考虑 可 用 
性 ， 并 为 客户 和 办 事 员 另 找 一 个 输入 数据 的 方法 了 。 
即使 没有 数据 传输 问题 ， 当 有 数 千 个 条 目 时 选择 框 也 不 是 最 好 的 方案 。 一 些 输入 框 试图 
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在 用 户 输入 名 字 或 产品 的 前 几 个 字符 时 ， 就 自动 找到 匹配 的 条 目 ， 但 这 种 方法 仍然 需要 用 
户 知道 前 几 个 字符 。 因 此 ， 一 个 可 能 更 好 的 办 法 是 创建 更 加 详细 的 搜索 机 制 。 不 用 包含 所 
有 客户 的 选择 框 ， 用 户 输入 客户 姓 的 前 几 个 字符 ， 点 击 按钮 ， 并 得 到 一 个 小 点 儿 的 匹配 名 字 
列表 。 

订购 条 目 也 显示 出 类 似 的 问题 。 有 两 个 常见 的 解决 方案 : (1) 对 于 店内 的 销售 ， 把 一 个 
产品 人 D 号 绑 定 到 独立 商品 上 (比如 条 形 码 ) ，(2) 对 于 Web 销 售 ， 让 客户 搜索 商品 ， 在 购物 车 
里 维持 一 个 选中 的 了 号 集合 。 

对 于 仍然 想 要 使 用 选择 框 的 情况 ， 需 要 更 具有 创造 性 的 编程 。 例 如 ，Oracle 不 推荐 在 列表 
条 目 多 于 30 时 使 用 选择 框 。 作 为 替代 方案 ，Oracle 建 议 使 用 结合 值 列 表 (LOV) 的 标准 文本 框 。 
值 列 表 可 以 定义 为 一 个 查询 。 当 用 户 在 文本 框 中 输入 时 ， 可 以 从 值 的 列表 中 选 出 。 这 种 方法 
和 选择 框 如 何不 同 呢 ? 主要 的 区 别 在 表面 的 背后 。LOV 以 块 的 形式 提取 数据 ， 而 不 是 试图 一 
次 就 传输 整个 条 目 集 。 对 用 户 来 说 ， 列 表 显 得 是 连续 的 ， 但 通过 只 传输 当前 列表 显示 的 选择 ， 
LOV 减 少 了 传输 时 间 。 用 户 阅读 时 它 也 在 传输 数据 ， 所 以 时 间 就 更 不 显眼 了 。 即 使 你 的 厂商 
或 工具 不 直接 支持 ， 这 种 方法 也 可 以 使 用 。 在 Web 表 单 里 ， 简 单 地 创建 第 二 个 表单 ， 它 含 搜索 
功能 并 在 多 个 页 面 有 条 目 列表 。 当 用 户 找到 特定 条 目 时 ， 可 以 写 一 个 函数 把 选中 的 条 目 传送 
到 主 表单 。 

由 于 类 似 的 数据 传输 原因 ，Web 表 单 里 的 并 发 也 是 一 个 问题 。 在 工程 术语 中 ， 等 待 时 间 是 
系统 中 的 时 间 延 迟 。 在 表单 环境 中 ， 等 待 时间 是 从 生成 表单 到 从 用 户 处 得 到 响应 之 间 的 时 间 。 
如 果 等 待 时 间 很 长 ， 就 很 可 能 有 其 他 人 修改 同一 个 数据 元 素 ， 所 以 并 发 是 一 个 大 问题 。 如 图 
10-24 所 示 ， 在 Web 上 等 待 时 间 一 般 都 比较 长 ， 因 为 传输 线路 很 慢 ， 也 因为 用 户 不 经 意 地 使 用 
浏览 器 在 提交 表单 之 前 还 要 处 理 其 他 任务 。 因 此 ， 基 于 Web 的 应 用 应 该 避免 悲观 锁 ， 这 样 ， 数 
据 就 可 以 同时 为 更 多 的 人 所 用 。 所 以 ， 当 数据 被 另 一 个 进程 改变 时 ， 你 的 应 用 必须 测试 并 处 


理 乐观 的 并 发 问题 。 


生成 表单 收 到 表单 数据 
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传输 延迟 
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图 10-24 等 待 时 间 。 在 Web 表 单 中 ， 传 输 延 迟 和 用 户 延迟 可 能 引起 较 长 的 等 待 
时 间 。 避 免 悲 观 锁 ， 并 在 基本 的 数据 库 改变 时 进行 仔细 的 测试 
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10.9 XML:， 将 数据 传输 到 不 同 的 系统 


由 于 因特网 的 兴起 , 各 企业 对 于 把 数据 传送 给 其 他 公司 管理 的 计算 机 这 个 需求 增多 。 例 如 ， 
一 个 零售 商 可 能 希望 使 用 电子 数据 交换 (EDI) 给 供应 商 发 送 订 单 。 这 些 传送 的 挑战 在 于 ， 两 
个 公司 通常 拥有 不 同 的 硬件 、 不 同 的 网 络 以 及 不 同 的 软件 。 特 定 的 EDI 软 件 可 以 处 理 许多 这 类 
问题 ， 但 所 有 的 数据 传输 都 必须 属于 预定 义 的 类 别 。 

把 数据 传送 给 一 个 未 知 的 计算 机 的 挑战 首先 在 于 , 机 器 以 不 同 的 方式 处 理 原始 数据 。 例如 ， 
简单 数字 的 内 部 二 进 制 存储 在 基于 Intel 的 个 人 计算 机 、 基 于 Motorola 的 个 人 计算 机 (苹果 机 ) 
和 大 型 的 BM 计算 机 之 间 差 异 很 大 。 所 以 不 能 传输 二 进 制 ( 比 如 数据 库 ) 文件 ， 希 望 它们 在 不 
同 的 机 器 上 工作 。 必 须 提取 出 原始 数据 并 把 它 转化 为 文本 。 例 如 ， 并 不 是 以 二 字 节 的 数据 元 
素 (0x55 0xE4) 传输 一 个 整数 ， 而 是 把 它 转换 成 它 的 文本 表示 (21988)。 

即使 文本 传输 也 会 引起 问题 。 比 如 ， 和 个 人 计算 机 用 得 最 多 的 ASCII 码 比 起 来 ，IBM 机 器 
使 用 不 同 的 字母 表 / 数 字 系统 (EBCDIC)。 如 果 需 要 传输 到 其 他 语言 ， 数 据 就 应 该 转化 为 
Unicode 字 符 。 幸 运 的 是 ， 大 多 数 计算 机 都 可 以 轻易 地 在 这 些 标准 之 间 转 换文 本 数据 。 在 建立 
这 些 系统 来 确保 每 个 人 都 知道 文本 数据 的 格式 时 ， 只 需 小 心 从 事 就 行 了 。 

尽管 如 此 ， 即 使 用 文本 传输 数据 也 不 能 解决 所 有 问题 。 简 单 的 文本 数据 文件 并 不 包含 元 数 
据 : 和 文件 内 容 相关 的 信息 。 例 如 ， 如 果 你 接收 到 一 个 数字 表 ， 如 何 知 道 每 一 列 的 意思 ? 列 
标题 可 能 会 有 所 帮助 ， 但 它 可 能 并 不 包含 足够 的 信息 ， 并且 更 加 复杂 的 数据 传输 可 能 更 难以 
理解 。 考 虑 一 下 图 10-25 显 示 的 常见 订单 。 它 包含 单独 的 订单 行 ， 以 及 为 每 件 订 购 商 品 的 多 个 
元 素 。 
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图 10-25 层次 型 的 数据 文件 。 注 意 这 个 文件 的 结构 : 基本 的 订购 日 期 ， 然 后 是 
订购 商品 的 重复 元 素 ， 每 个 订购 商品 都 包含 ItemID (商品 ID )、 
Description (描述 ) 、Quantity (数量 ) 和 Cost (费用 ) 


这 种 可 扩展 标记 语言 (XML) 最 初创 建 来 解决 这 些 问题 。 在 某 些 方面 ， XML 和 HTML 类 
似 ， 都 是 从 一 个 更 复杂 的 叫做 标准 通用 标记 语言 (SGML) 衍生 而 来 的 。 但 是 ，HTML 设 计 来 
显示 数据 ， 而 XML 设 计 来 传输 数据 。XML 使 用 标签 来 指示 数据 的 作用 。XML 的 强大 之 处 就 在 
于 你 可 以 创建 所 需 的 任意 标签 。 

当 给 其 他 人 传输 数据 时 ， 指 定 文件 的 布局 ， 并 提供 描述 数据 文件 中 每 一 元 素 的 元 数据 也 是 
很 重要 的 。XML 的 模式 定义 (XSD) 文件 设计 来 展示 XML 文件 的 全 局 布局 。 图 10-26 展 示 了 一 
个 为 基本 的 订单 而 设计 的 xsd 文 件 的 一 部 分 。 这 个 版 本 是 用 微软 .NET 的 xsd.exe 工 具 自 动 生成 的 。 
你 可 以 得 到 更 简明 的 定义 。 要 注意 的 是 ， 定 义 文件 展示 了 数据 的 布局 ， 并 提供 了 描述 每 个 域 
元 素 的 元 数据 。 

一 个 含有 完 物 商店 货物 订单 示例 数据 的 XML 文 件 如 图 10-27 所 示 。OrderList 是 整个 文档 的 
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根 标签 ， 指 明 这 个 文件 可 能 包含 不 止 一 个 订单 ， 但 这 里 只 显示 了 文件 的 一 部 分 。 每 个 订单 都 
包含 若干 个 描述 订购 的 元 素 (OrderDate (订购 日 期 )、ShippingCost 〈 送 货 费 用 ) 和 Comment 
(注释 ) ) 。 每 个 订单 可 能 包含 若干 个 将 要 订购 商品 的 列表 。 每 个 商品 都 有 自己 的 标识 列表 
(ItemID (商品 ID)、Description (描述 ) 、Quantity (数量 ) 和 Cost (费用 ) )。 这 些 商品 的 数据 
都 包含 在 文件 中 ， 并 由 适当 的 开 、 闭 标签 括 了 起 来 。 

可 以 使 用 微软 的 卫 训 览 器 来 检查 XML 文件 的 内 容 。 如 图 10-28 所 示 ， 浏 览 器 提供 数据 的 一 
个 简单 层次 视图 。 点 击 显 示 内 容 左 边 的 +/ 一 标记 将 展开 或 收缩 层次 列表 。 基 本 的 浏览 器 仅仅 提 
供 原始 数据 的 一 个 简单 视图 。 你 绝对 不 会 利用 它 给 用 户 真 实地 展现 数据 。 取 而 代 之 ， 可 以 构 
建 XSL 样 式 单 来 指定 每 个 元 素 的 布局 和 格式 。 但 是 ， 这 个 简易 视图 是 检查 要 发 送 到 其 他 公司 的 
XML 文件 中 原始 数据 的 简单 方法 。 





<?xml] version="1.0” encoding="utf-8"?> 
<xs:schema id="OrderList”" xmins="”"* xmins:xs="*http://www.w3.org/2001/XMLSchema” 
xmlns:msdata="urn:schemas-microsoft.com:xmi-msdata*> 
<Xs :element name="“OrderList” msdata:IsDataSet="true”"> 
<xs:complexType> 
<xs:choice maxOccurs="unbounded"> 
<XS:element name="Order*”> 
<xs:complexType> 
<xSs:sequence> 
<xs:element name="*OrderIiD” type="xs:string” minOccurs="0"/> 
<xs:element name=“OrderDate” type="xs:date” minOccurs="0"/> 
<xs:element name="ShippingCost”" type="xs:string"” minOccurs="0*/> 
<xs:element name="“"Comment” type="*xs:string” minOccurs="0"”/> 
<xs:element name="Items” minOccurs="0"” maxOccurs="unbounded”"> 
<xs:complexType> 
<XS :Sequence> 
<XS :element name="ItemID” nilLable=*true” minOccurs="0” 
maxOccurs="unbounded”> 
<xs:complexType> 
<xs:simpleContent msdata:ColumnName="ItemID Text” 
msdata:Ordinal="0"°> 
<XSs : extension base="xs:string’”> 
</xs:extension> 
</xs:simpleContent> 
</xs:complexType> 
</xs:element> 
<xs:element name="Description” nillable="true” minOccurs="0" 
maxOccurs="unbounded"> 
<XS :complexType> 
<xs:simpleContent msdata:ColumnName="Description_ Text” 
msdata:Ordinal="0"> 
<xs:extension base="xs:string”> 
</xs:extension> 
</xs:simpleContent> 
</Xxs:complexType> 
</xs:element> 








图 10-26 部 分 XSD 文 件 。 模 式 定义 描述 了 XML 数 据 文件 的 布局 以 及 将 要 传送 
数据 的 类 型 。 注 意 这 种 层次 型 的 布局 和 独立 的 域 定义 
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<?xXml Version= ”1 .0”?> 

<IDOCTYPE OrderList SYSTEM "orderlist.Gtd”> 
<OrderList> 

<Order> 

<OrderID>1</OrderID> 
<OrderDate>3/6/2004</0rderDate> 
<ShippingCost>$33.54</ShippingCost> 

<Comment>Need immediately.</Comment> 

<Items> 

<ItemID>30</ItemID> 

<Description>Flea Collar-Dog-Medium</Description> 
<Quantity>208</Quantity> 

<Cost>$4.42</Cost> 

<ItemID>27</ItemIiD> 

<Description>Aquarium Filter &amp; Pump</Description> 
<Quantity>8</Quantity> 

<Cost>$24.65</Cost> 

</Items> 

</Order> 

</OrderList> 





图 10-27 XML 文 件 示例 。XML 文 件 包含 实际 的 数据 。 每 个 元 素 都 由 一 个 开标 
签 和 一 个 闭 标签 括 起 来 


< ?Xml version="1.0*?> 
<1DOCTYPE OrderList (View Source for full doctype...)> 
~ <OrderList> 
一 <OrQer> 
<OrderID>1</OrderID> 
<OrderDate>3/6/2004</OrderDate> 
<ShippingCost>$33.54</ShippingCost> 
<Comment>Need immediately.</Comment> 
— <Items> 
<ItemID>30</ItemID> 
<Description>Flea Collar-Dog-Medium< /Description> 
<Quantity>208</Quantity> 
<Cost>$4%.€2</Cost> 
<ItemID>27</ItemID> 
<Description>Aquariuwm Filter & Pump</Description> 
<Quantity>8</Quantity> 
<Cost>$24.65</Cost> 
</Items> 
</Order> 
+<Order> 
+<Order> 
</OrderList> 





图 10-28 在 IE 浏 览 器 里 的 XML 文 件 。 浏 览 器 提供 XML 文 件 中 原始 数据 的 一 个 
层次 视图 。 也 可 以 构建 XSL 样 式 单 来 改善 显示 


XML 的 优势 在 于 可 以 相对 容易 地 构造 出 解析 器 提取 数据 ， 并 在 其 他 应 用 中 使 用 。 事 实 上 ， 
有 些 公司 提 供 通 用 的 XML 解析 器 。 你 的 应 用 代码 可 以 激活 解析 器 ， 并 告诉 它 自动 提取 数据 的 
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不 同 部 分 。XML 另 一 个 强大 的 方面 是 有 数量 庞大 的 厂商 支持 。 它 也 是 下 一 版 本 的 SQL 标准 
(200x) 要 增加 的 主要 内 容 。 因 此 ， 许 多 工具 和 应 用 都 已 经 支持 从 内 部 数据 格式 到 XML 的 来 回 
转换 。 面 对 越 来 越 多 的 任务 ， 无 需 理解 XML。 只 需要 简单 地 告诉 某 个 应 用 生成 XML 和 XSD 文 
件 ， 把 它们 传送 到 其 他 系统 ， 并 让 它 正 确 读 取 数 据 就 行 了 。 在 XSD 文件 的 驱使 下 ， 所 有 这 些 
转换 都 是 自动 的 。 


10.10 ” Java 语言 和 JDBC 


Java 是 由 Sun Microsystems 公 司 开发 的 语言 ， 基 于 Web 的 操作 系统 广泛 采用 。 其 中 一 个 目 
标 就 是 提供 一 个 可 以 用 于 任何 常见 硬件 的 软件 平台 。 作 为 这 个 环境 中 的 一 部 分 ，JDBC 引 和 来 
处 理 Java 和 商业 数据 库 之 间 的 交互 。 解 释 一 下 ，JDBC 并 不 是 只 取 首 字母 的 缩写 ， 而 是 一 个 商 
标的 名 字 ， 但 人 们 常常 用 它 来 指 代 Java 数 据 库 连接 。JDBC 是 Java 2 企业 版 (J2EE) 的 重要 组 
件 ， 它 是 构建 数据 驱动 网 站 的 一 种 基于 服务 器 的 平台 技术 。 

如 图 10-29 中 一 个 小 段 引 用 所 示 ，JDBC 的 结构 和 诸如 ADO 等 数据 库 语言 类 似 : 代码 必 
须 首 先 建立 到 数据 库 的 连接 。 接 下 来 创建 包含 SQL 查询 的 语句 。 然 后 编写 一 个 基于 游标 的 循 
环 来 逐 行 地 处 理 查询 结果 (ResultSet) 。 基 本 的 JDBC 命 令 将 完成 从 查询 到 Java 变 量 中 的 数据 
传输 。 


Connection con = DriverManager .getConnection( 
“jdbc .myDriver :myDBName”, 
“myLogin”, 
"myPassword”); 
Statement smt con.CreateStatement (); 
ResultSet rst smt .executeQuery ( 
“SELECT AnimalID, Name, Category, Breed 
FROM Animal”); 


while (zst.next())1{ 
int iAnimal = rst.getint (“AnimalID”); 
String sName = rst.getString ("Name”); 
String sCategory = rst.getString ("Category”’); 
String sBreed = rst.getSstring (“Breed’); 


\\ Now do something with these four variables 
} 





图 10-29 JDBC 代 码 的 结构 。 全 局 的 结构 和 特性 与 微软 的 ADO 方 法 类 似 


当然 ， 需 要 更 多 的 安装 和 编程 来 让 这 个 例子 运行 。 比 如 ， 需 要 安装 Java 的 全 部 、JDBC 以 
及 连接 到 希望 使 用 的 数据 库 的 JDBC 驱 动 程序 。 这 个 例子 的 目的 是 给 你 展示 其 代码 的 结构 和 本 
书 其 他 章节 所 用 的 代码 结构 是 相同 的 。 虽 然 语法 和 命令 不 向 ， 但 其 逻辑 是 一 样 的 。 


小 结 


随 着 企业 的 壮大 ， 分 布 式 数 据 库 变 得 有 用 起 来 。 分 布 式 数据 库 可 以 让 公司 扩展 部 门 而 不 直 
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接 影响 其 他 人 。 分 布 式 数 据 库 也 给 了 各 个 部 门 对 他 们 的 数据 的 更 多 控制 和 责任 。 

尽管 如 此 ， 带 有 运行 在 不 同 场地 的 独立 数据 库 引 擎 的 分 布 式 数据 库 增加 了 开发 和 维护 应 用 
的 复杂 性 。 分 布 式 数 据 库 的 一 个 主要 目标 就 是 让 数据 的 场地 对 用 户 透 明 。 为 了 达到 这 个 目标 ， 
开发 者 和 DBA 需 要 仔细 地 定义 数据 库 、 网 络 和 应 用 。 

一 些 分 布 式 数据 库 引 起 的 复杂 性 是 查询 优化 ， 数 据 复制 问题 以 及 对 事务 、 并 发 控制 和 死 锁 
解决 的 支持 。 这 些 问 题 在 涉及 多 个 数据 库 时 会 变 得 更 加 复杂 。 数 据 的 网 络 传输 比 本 地 磁盘 传 
输 慢 很 多 。 在 广域网 上 的 传输 可 能 又 慢 又 费 钱 。 这 些 因 素 意味 着 开发 者 必须 仔细 设计 应 用 和 
数据 分 布 策略 。 应 用 还 必须 测试 ， 并 接受 性 能 和 成 本 的 监控 。 

设计 和 控制 分 布 式 数据 库 的 一 个 主要 策略 是 复制 数据 。 与 维护 一 个 源 不 同 ， 在 多 个 场地 中 
复制 那些 使 用 频繁 的 数据 常常 更 加 高 效 。 当 然 ， 复 制 需要 额外 的 磁盘 空间 ， 以 及 周期 性 的 升 
级 和 把 数据 改变 传 到 每 一 份 副本 上 。 复 制 通过 提供 数据 的 本 地 访问 节省 了 时 间 。 它 通过 降低 
对 全 时 高 速 连接 的 需求 而 降低 了 成 本 。 作 为 替代 ， 大 块 数据 以 一 个 规则 的 间隔 传输 一 一 且 更 趋 
向 于 在 非 高 峰 通 信 阶 段 传输 。 

客户 端 /服务 器 网 络 和 客户 端 /服务 器 数据 库 是 设计 应 用 和 分 布 式 数据 库 的 常见 方法 。 客 户 
端 通常 在 个 人 计算 机 上 运行 应 用 ， 它 们 的 大 部 分 功能 是 在 用 户 界面 上 。 数 据 由 有 限 数目 的 数 
据 库 服务 器 来 维护 ， 这 比 简单 的 文件 服务 器 传输 要 高 效 。 在 服务 器 数据 库 中 ， 客 户 端 发 送 SQL 
查询 ， 然 后 服务 器 处 理 这 个 查询 并 只 返回 需要 的 数据 。 在 文件 服务 器 中 ， 客 户 端 计算 机 执行 
所 有 的 处 理 ， 而 且 必 须 提 取 和 检查 所 有 的 数据 。 

更 大 的 、 面 向 对 象 的 应 用 一 般 使 用 三 层 的 客户 机 /服务 器 架构 来 创建 。 附 加 的 层 在 中 间 ， 
并 包含 商业 规则 和 运行 在 服务 器 上 的 程序 代码 (商务 对 象 )。 中 间 层 也 要 负责 从 数据 库 服务 器 
中 提取 数据 并 根据 客户 端的 使 用 重新 格式 化 。 这 三 层 的 分 离 使 得 不 影响 其 他 元 素 而 修改 任意 
组 件 变 得 更 容易 了 。 

万 维 网 正在 成 为 创建 客户 端 /服务 器 应 用 的 流行 机 制 。 客 户 端 只 有 有 限 的 功能 ， 但 标准 使 
得 每 个 人 访问 应 用 和 数据 都 变 得 更 容易 。 所 有 Web 工 具 的 功能 都 迅速 增强 ， 让 开发 者 扩展 他 们 
的 应 用 更 加 容易 。 工 具 和 应 用 支持 XML 的 话 ， 也 会 使 不 同 公司 、 机 器 和 应 用 间 传 输 数据 变 得 
更 加 简单 。 
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关键 词 
活动 数据 对 象 锚 标 签 浏览 器 客户 机 /服务 器 
通用 网 关 接口 分 布 式 数据 库 电子 数据 交换 可 扩展 标记 语言 
超 文本 链接 Java 语 言 Java 2 企业 版 JDBC 
等 待 时 间 值 列 表 局 域 网 开放 式 数 据 库 互 连 
复制 复制 管理 器 三 层 客 户 端 /服务 器 
两 阶段 提交 广域网 万 维 网 

复习 题 


1. 分 布 式 数据 库 的 优势 和 缺陷 各 是 什么 ? 
2. 让 分 布 式 数据 库 对 用 户 透明 需要 哪些 特性 ? 
3. 为 什么 在 分 布 式 数据 库 上 的 查询 可 能 运行 很 长 时 间 ? 
4. 在 分 布 式 数据 库 中 ， 什 么 时 候 需 要 复制 数据 ? 
5. 为 什么 并 发 在 分 布 式 数 据 库 中 比 在 单一 数据 库 中 问题 更 大 ? 
6. 两 阶段 提交 过 程 如 何 工作 ? 
7. 为 什么 客户 机 /服务 器 数据 库 比 简单 的 文件 服务 器 上 的 数据 库 更 为 有 效 ? 
8. 哪些 工具 有 助 于 连接 不 同 厂 商 的 数据 库 ? 
9. 三 层 的 客户 机 /服务 器 方法 都 有 什么 优势 ? 
10. 因特网 上 的 Web 客 户 端 都 有 哪些 功能 ? 
11. 什么 是 XML? 它 在 数据 传输 中 有 什么 作用 ? 


练习 


1. 探索 那些 用 于 构建 三 层 客 户 机 /服务 器 应 用 的 软件 。 描 述 这 些 软件 的 功能 。 解 释 各 种 组 件 如 
何 分 配 到 每 一 层 上 。 例 如 ， 考 虑 VB 企业 版 或 者 J2EE。 
2. 你 拥有 下 面 的 分 布 式 数据 库 : 


| 地 点 | 过 久 | 和 束 


S53kbps Part(PartiD, Description, Size, ListPrice) 


波士顿 
ml Order(OrderlD, OrderDate, DateShipped, DateReceived) 
1.544mbps 







大 小 
1 500 行 
300 000 行 
3 000 000 行 
1000 行 
200 000 行 



















_ OrderPart(Qrderld, PartiD, Quantity, SalePrice 
Part(PartiD, Description, Size, ListPrice) 
Order(QrderiD, OrdetDate, DateShipped, DateReceived) 

























OrderPart(QrderiD, ParttD, Quantity, SatePrice) 2 000 000 行 
128kbps ltem(BarCode, Description, ListPrice) 70 000 行 
Sales(SalelD, SaleDate, SalesTax, RegisteriD) 1 000 000 行 
Saleltem(TransactionlD, SalelD, BarCode) 40 000 000 行 
丹佛 Assembly(EmployeelD, BarCodelD, PartiD, DateTime) 1 000 000 行 
(HQ) Shipment(ShiplD, CustomerlD, ShipDate) 50 000 行 
Shipitem( ShiplD, BarGode, Quantity) 10 000 行 





你 为 一 家 供应 商 在 波士顿 和 西雅图 、 主 要 客户 在 迈阿密 的 公司 工作 。 供 应 商 的 系统 可 
以 让 你 发 送 XML 查询 以 及 当 部 分 到 达 时 提取 数据 。 同 样 ， 客 户 提供 对 主 销售 数据 库 的 访 
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问 ， 这 样 你 就 可 以 检查 商品 的 销售 情况 。 你 的 CEO 注 意 到 一 种 商品 在 过 去 10 天 显然 集中 返 
还 给 客户 了 若干 次 ， 她 想 让 你 找 出 哪些 雇员 和 供应 商 与 那个 特定 商品 有 关 。 基 于 通信 速度 
和 表 的 大 小 ， 设 计 回答 问题 的 最 好 查询 。 可 以 通过 改变 分 布 式 设计 来 提高 数据 库 和 查询 的 
性 能 吗 ? 

.一 个 公司 在 同一 个 州 有 两 个 相距 100 英 里 的 卫星 办 公 室 。 主 要 的 数据 处 理 是 在 1 000 英 里 外 

的 一 个 数据 中 心 进行 的 。 两 个 办 公 室 都 用 T1 (1.544 mbps) 线路 连接 到 主 站 点 。 经 理想 让 

你 开发 一 个 给 两 个 办 公 室 的 雇员 用 的 数据 库 。 这 个 数据 库 将 跟踪 客户 的 交互 。 每 个 本 地 和 雇 

员 (每 个 地 点 大 约 10 个 ) 将 跟踪 他 /她 的 客户 (在 任何 时 间 点 每 个 雇员 大 约 有 50 个 活动 客户 ) ， 

并 且 数 据 每 个 月 经 理 复查 一 次 。 这 个 数据 库 最 好 的 分 布 式 设计 是 什么 ? 

.你 被 一 家 在 若干 个 不 同 的 州都 有 工厂 的 企业 聘 为 顾问 。 情 况 比较 好 ， 这 些 工 广大 都 用 

1.544 mbps 的 T1 线 路 连接 着 ， 有 一 些 是 用 128 kbps 的 ISDN 连接 着 。 应 用 程序 维护 着 每 个 工 

厂 业务 的 详细 数据 ， 还 有 价格 、 规 则 以 及 主管 创建 的 过 程 。 这 个 应 用 对 每 个 工厂 执行 复杂 

的 处 理 ， 并 生成 大 量 的 同时 被 工厂 和 总 部 专家 使 用 的 数据 。 此 公司 希望 这 个 应 用 运行 在 

Oracle 数 据 库 上 ， 并 用 Visual Basic 处 理 过 程 。 建 立 这 个 数据 库 的 基本 结构 。 哪 些 部 分 应 该 

分 布 ? 哪些 部 分 应 该 集中 ? 

5. 对 于 分 布 式 系统 来 说 ， 把 所 有 数据 都 存在 一 个 主 站 点 、 所 有 客户 端 都 通过 Web 浏 览 器 访问 
的 集中 式 网 站 有 哪些 优 缺 点 ? 

Sally 的 宠物 商店 

6. Sally 计 划 增 加 第 二 个 商店 。 写 一 份 描述 数据 如 何 共 享 的 计划 。 你 如 何 控制 和 监视 新 系统 ? 
你 将 添加 哪些 工具 ? 

7. Sally 想 连接 到 一 些 饲养 站 点 ， 以 便 她 可 以 获得 有 关 动 物 的 实时 信息 一 一 包括 健康 和 谱系 信 
息 。 解 释 你 将 如 何 建立 系统 来 实现 这 种 数据 共享 。 

8. 为 宠物 商店 定义 一 个 三 层 系 统 。 特 别 是 ， 你 将 把 哪些 商业 规则 和 应 用 存放 到 中 间 层 ? 

9. 创建 一 个 网 站 ， 这 样 Sally 可 以 让 潜在 的 客户 搜索 特定 的 动物 。 

10. 扩展 数据 库 ， 为 Sally 的 好 客户 们 创建 网 站 。 当 客户 每 年 的 购买 额 超过 1 000 美 元 时 ， 他 们 
将 收 到 一 个 电子 邮件 信息 ， 指 向 一 个 特殊 网 站 ， 在 那里 他 们 可 以 查看 最 近 的 购买 ， 以 及 订 
购 新 的 商品 。 

Rolling Thunder 自 行车 

11. Rolling Thunder 计 划 扩 张 到 跨国 的 第 二 个 站 点 。 数 据 库 应 该 如 何 分 布 ? 每 张 表 应 该 存 到 哪 
里 ? 哪些 表 应 该 复制 以 及 如 何 保证 数据 更 新 的 一 致 性 ? 

12. Rolling Thunder 计 划 通 过 向 全 国 不 同 的 自行 车 商店 派出 销售 代表 来 进行 扩展 。 他 们 将 拥有 
笔记 本 电脑 来 配置 和 接收 新 订单 。 但 大 多 数 自行 车 商店 设 有 因特网 连接 ， 所 以 系统 必须 能 
离线 工作 。 描 述 一 下 这 种 系统 将 如 何 工作 。 需 要 哪些 安全 防备 ? 

13. 如 果 你 有 一 个 三 层 的 客户 机 /服务 器 系统 ， 描 述 一 下 你 将 在 每 一 地 点 〈 客 户 端 、 服 务 器 、 中 
间 件 ) 存放 哪些 组 件 。 证 实 并 检查 你 的 选择 。 

14. 构建 一 张 Web 表 单 ， 让 客户 可 以 检查 他 们 自行 车 的 订购 进程 。 

15. 把 与 购买 相关 的 表 和 数据 库 分 开 ， 并 把 它们 移 到 第 二 个 服务 器 的 一 个 新 数据 库 里 去 。 修 改 
或 重建 购买 和 制造 表单 ， 以 便 它 们 可 以 继续 在 原来 的 计算 机 上 工作 。 


wy 


小 
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词汇 表 


24-7: 每 周 7 天 ， 每 天 24 小 时 一 一 应 用 或 数据 库 每 周 运行 7 天 ， 每 天 运行 24 小 时 。 由 于 数 
据 库 不 可 能 关闭 ， 所 以 性 能 维护 很 有 挑战 性 。 

abstract data type: 抽象 数据 类 型 一 一 在 SQL1999 中 ， 具 有 定义 支持 继承 性 存储 对 象 的 
更 复杂 数据 域 的 功能 。 

accessibility: 可 访问 性 一 一 应 用 的 设计 目标 ， 使 应 用 可 以 尽 可 能 多 地 由 用 户 使 用 ， 包 括 
身体 有 残疾 的 人 。 解 决 方案 就 是 支持 多 种 输入 、 输 出 方法 。 

ACID transactions:， ACID 事务 一 一 这 个 关于 事务 的 首 字 母 缩写 词 指出 安全 事务 所 需 的 4 
个 要 素 ， 原子 性 、 一 致 性 、 隔 离 性 和 持久 性 。 

active data object (ADO) 活动 数据 对 象 一 一 微软 用 于 把 程序 代码 和 Web 服 务 器 小 程序 
连接 到 数据 库 的 组 件 (COM) 方法 。 提 供 了 对 任何 数据 库 进行 SQL 语 句 和 基于 行 的 访问 。 

active server pages (ASP) : 动态 服务 器 页 面 一 一 微软 的 Web 页 面 ， 支 持 在 服务 器 上 运 
行 小 程序 。 有 助 于 对 因特网 用 户 提 供 服 务 器 数据 库 的 访问 。 

Advanced Encryption System (AES) :高 级 加 密 系 统一 一 一 个 用 来 替代 PES， 基 于 
Belgian 加 密 系统 (Rijndael) 的 单 密 钥 加 密 系 统 。 它 支持 128、192 和 256 位 的 密 钥 长 度 ， 从 而 
比 PES 更 安全 。 

aesthetics; 美学 一 一 应 用 的 设计 目标 ， 利 用 布局 、 颜 色 和 艺术 来 改善 应 用 的 外 观 一 一 别 
不 重视 。 从 本 质 上 讲 ， 任 何 设计 的 价值 都 是 主观 的 。 

aggregation : 聚集 (运算 ) 一 一 在 若干 选中 的 数据 行 上 进行 操作 的 SQL 函 数 的 总 称 。 常 
见 的 例子 包括 SUM、COUNT 和 AVERAGE。 

aggregation association: 聚集 关联 一 一 一 种 关系 ， 表 示 个 体 项 成 为 新 类 的 一 个 元 素 。 例 
如 ， 订 单 包含 商品 。 在 UML 中 ， 这 种 关系 用 一 个 小 的 空心 鞭 形 在 关联 端 表示 。 参 见 Composi- 
tion association 。 

alias: 别名 一 一 表 或 列 的 临时 名 字 。 常 常用 于 需要 多 次 引用 相同 的 表 时 ， 例 如 自 反 连 接 。 

ALL 一 一 常用 于 子 查询 的 SQL SELECT 子 句 。 如 果 用 于 WHERE 子 句 ， 则 匹配 列表 中 的 所 
有 项 。 例 如 ,“Price > All (…)” 表 示 只 选择 比 列表 中 价格 最 高 的 还 要 高 的 数据 行 。 

ALTER TABLE- 一 SQL 数据 定义 命令 ， 用 于 改变 表 的 结构 。 为 了 提高 性 能 ， 一 些 系统 限 
制 了 对 增加 新 列 的 更 改 。 在 这 些 情况 下 ， 要 做 重大 的 修改 ， 就 只 能 创建 新 的 表 ， 并 把 老 数据 
复制 过 来 。 

anchor tag: 销 标签 一 一 指示 链接 的 HTML 标 签 。 用 <A> 表 示 。 

ANY 一 一 常用 于 子 查询 的 SQL SELECT 子 句 。 如 果 用 于 WHERE 子 句 ， 则 至 少 匹 配 列表 中 的 
一 项 。 例 如 ，“Price > ANY (…)” 表 示 只 要 价格 比 列表 中 的 某 一 项 高 就 是 满足 条 件 的 数据 行 。 

application : 应 用 (应 用 程序 ) 一 个 执行 特定 任务 集合 的 完整 系统 。 一 般 情况 下 ， 它 
包括 集成 的 表单 和 报表 以 及 菜单 和 帮助 系统 。 
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Application Design Guide: 应 用 设计 指导 一 一 在 构建 应 用 时 应 该 遵循 的 标准 设计 概念 集 
合 。 这 些 标准 使 用 户 操作 新 应 用 变 得 更 简单 ， 因 为 他 们 在 一 个 系统 中 学 到 的 技术 也 适用 于 另 
一 个 系统 。 

application generator: 应 用 生成 器 一 一 一 个 帮助 开发 者 创建 完整 应 用 包 的 DBMS 工 具 。 
常见 的 工具 包括 菜单 和 工具 栏 生成 器 以 及 集成 的 上 下 文 帮助 系统 。 

association : 关联 一 一 类 和 实体 之 间 的 联系 。 通 常 ， 它 们 表示 商业 规则 。 例 如 ， 一 次 订 
购 可 以 由 一 个 客户 完成 。 区 分 关联 是 一 对 一 、 一 对 多 还 是 多 对 多 ， 非 常 重 要 。 

association role: 关联 角色 和 UMEL 中 关联 乡 定 到 类 上 的 那 一 点 。 它 可 以 有 名 字 ， 一 
般 显示 重复 度 、 察 集 或 组 合 等 。 

association rules: 关联 规则 一 一 一 种 数据 挖 据 技 术 ， 用 于 检查 一 系列 事务 来 发 现 哪 些 项 
经 常 被 一 起 购买 。 

atomicity : 原子 性 一 一 事务 的 要 素 之 一 ， 它 指定 事务 中 所 有 的 操作 必须 同时 成 功 或 同时 
失败 。 

attribute ， 属 性 一 一 实体 的 特征 或 属性 。 在 数据 表 中 属性 可 能 是 一 列 。 和 雇员 的 属性 可 能 包 
括 姓名 、 地 址 、 雇 佣 日 期 和 电话 等 。 

authentication ， 认证 一 一 一 个 验证 系统 ， 用 来 确定 究竟 是 谁 写 了 消息 。 常 见 的 系统 使 用 
双 密 钥 加 密 机 制 。 

autonumber: 自动 标识 一 一 一 种 数据 类 型 域 ， DBMS 自 动 为 每 一 行 新 数据 都 分 配 一 个 惟 
一 的 标识 。 用 来 帮助 生成 关系 表 的 主 码 ， 

B+-tree: B+ 树 一 一 一 种 索引 型 的 数据 存储 方法 ， 对 很 大 范围 的 数据 访问 比较 有 效 。 树 的 
检索 提供 了 稳定 的 性 能 ， 而 且 不 受 数据 库 大 小 的 影响 。 

base table: 基本 表 一 一 与 一 个 基本 实体 相关 的 数据 表 。 它 通常 不 包括 外 码 ， 所 以 数据 可 
以 不 参考 其 他 表 而 输入 进来 。 例 如 ， 客 户 可 能 就 是 一 个 基本 表 ， 而 订单 就 不 是 。 

BETWEEN 一 一 SQL 比较 操作 符 ， 用 来 确定 某 项 是 否 落 到 了 两 个 值 之 间 。 对 日 期 操作 很 
有 用 。 

binary large object (BLOB): 二 进 制 大 对 象 一 一 大 块 未 定义 数据 的 数据 域 。BLOB (或 
简称 为 二 进 制 大 对 象 ) 可 以 支持 任何 数据 类 型 ， 但 程序 员 要 负责 数据 的 显示 、 操 纵 和 检索 。 

binary search: 二 分 搜索 一 一 一 种 针对 有 序数 据 的 检索 技术 。 从 数据 的 中 间 值 开始 ， 如 
果 检 索 值 比 中 间 值 大 ， 就 把 后 面 的 数据 一 分 为 二 。 如 此 进行 下 去 ， 直 到 找 出 所 要 的 值 。 

bitmap index: 位 图 索引 一 一 一 种 紧 竣 、 高 速 的 索引 方法 ， 索 引 码 值 和 条 件 都 压缩 到 很 小 
的 范围 ， 从 而 可 以 快速 存储 和 检索 数据 。 

Boolean algebra: 布尔 代数 一 一 创建 并 操纵 用 AND、OR 和 NOT 条 件 连 接 起 来 的 逻辑 
查询 。 

bound control， 绑 定 控件 一 一 种 绑 定 在 数据 库 列 上 的 表单 控件 。 当 输入 或 改变 数据 时 ， 
数据 更 新 就 会 自动 保存 到 数据 表 中 。 

Boyce-Codd normal form (BCNF) ， Boyce-Codd 范 式 一 一 所 有 的 依赖 都 必须 由 码 来 显 式 
地 指出 ， 不 含有 非 码 和 码 列 的 隐 含 依赖 。 

browser: 浏览 器 一 一 客户 计算 机 上 的 一 个 软件 包 ， 用 于 从 因特网 上 访问 和 显示 Web 页 面 。 
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brute force attack， 穷 举 攻 击 一 一 一 种 攻击 方法 ， 它 试图 通过 试验 口令 或 密 钥 的 全 部 组 合 
来 突破 安全 系统 。 

call-level interface (CLI) : 调用 级 接口 一 一 一 组 动态 连接 库 ， 它 使 程序 员 可 以 利用 
DBMS 之 外 的 语言 (例如 C++) 和 DBMS 的 特性 来 工作 。DBMS 提 供 通信 和 库 ， 并 自己 处 理 大 部 
分 数据 交换 。 

cascading delete， 级 联 删除 一 一 当 表 由 数据 连接 起 来 时 ， 如 果 在 更 高 级 别 的 表 中 删除 一 
行 ， 其 他 表 中 与 之 匹配 的 行 就 会 自动 删除 。 例 如 ， 如 果 删 除了 1173 号 客户 ， 则 该 客户 的 所 有 
订单 也 自动 删除 。 

cascading triggers: 级 联 触发 器 一 一 一 个 更 新 操作 触发 某 个 表 的 触发 器 ， 而 该 触发 器 的 
操作 又 造成 第 二 张 表 的 更 新 ， 接 着 又 引起 了 第 三 张 表 的 更 新 ， 依 此 类 推 ， 这 一 系列 更 新 就 可 
能 引发 多 个 触发 器 事件 。 

CASE 一 一 SQL 操作 符 ， 被 大 多 数 系统 所 支持 。 它 同时 检查 多 个 条 件 ， 当 找到 匹配 的 条 件 
时 就 采取 相应 的 行动 。 
certificate authority ， 认 证 中 心 
check box， 复 选 框 一 一 一 种 表示 选择 的 方形 按钮 。 通 过 设计 向 导 ， 用 户 可 以 用 复 选 框 选 
择 多 个 选项 ， 与 单 选 框 只 能 在 多 个 选项 中 选取 一 个 不 同 。 

clarity: 清晰 性 一 一 使 应 用 更 易 使 用 的 目标 。 通 过 配合 用 户 任务 的 优雅 设计 和 组 织 ， 使 应 
用 的 使 用 对 用 户 更 加 清晰 。 

class: 类 一 一 对 有 着 相似 结构 、 行 为 和 关系 的 一 系列 对 象 的 描述 符 。 也 就 是 说 ， 类 是 商 
务实 体 的 模型 描述 。 商 务 模型 可 能 包括 雇员 类 ， 而 一 个 具体 的 雇员 就 是 那个 类 的 一 个 对 象 。 

class diagram :类 图 一 一 按照 关系 把 很 多 类 连接 起 来 的 图 。 它 用 来 展示 模型 的 静态 结构 ， 
与 实体 -关系 图 类 似 。 

class hierarchy:， 类 层次 一 一 突出 了 类 之 间 继 承 关 系 的 图 。 

classification analysis; 分 类 分 析 一 一 一 种 数据 挖掘 技术 ， 它 把 诸如 客户 这 样 的 对 象 分 成 
组 ， 并 决定 哪些 因素 是 重要 的 分 类 变量 。 

client/server: 客户 机 /服务 器 一 一 一 种 组 织 系 统 的 技术 : 只 有 一 些 计 算 机 存储 绝 大 部 分 数 
据 ， 这 些 数据 由 使 用 客户 端 计算 机 的 个 人 来 提取 。 

cluster analysis， 聚 类 分 析 一 一 一 种 数据 挖掘 技术 ， 它 把 数据 集 的 元 素 分 组 ， 常 常 是 基 
于 项 与 项 之 间 的 相似 度 的 。 

cold site; 冷 站 一 一 灾难 备份 专家 可 供出 租 的 设施 。 冷 站 包含 动力 和 通信 线路 ， 但 没有 计 
算 机 。 灾 难 发 生 时 ， 公 司 会 呼叫 计算 机 厂商 ， 请 求 厂商 把 首 批 可 用 的 计算 机 送 往 冷 站 。 

collaboration diagram : 协作 图 一 一 一 种 显示 对 象 间 交互 关系 的 UML 图 。 它 不 把 时 间作 
为 一 个 独立 的 维 来 显示 ， 用 来 对 过 程 建 模 。 

combo box: 组 合 框 一 一 列表 框 和 文本 框 的 组 合 ， 用 于 输入 新 数据 或 从 列表 项 中 选择 。 与 
列表 框 相 比 ， 组 合 框 节 省 空间 ， 因 为 只 有 当 用 户 选 择 时 列表 才 会 显示 。 也 就 是 Web 表 单 中 的 选 
择 框 。 

command button ， 命 令 按钮 一 一 一 种 设计 来 点 击 的 表单 按钮 。 当 点 击 按钮 时 ， 会 激活 设 
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计 者 编写 的 代码 。 

common gateway interface (CGI) : 通用 网 关 接 口 一 一 在 Web 服 务 器 中 ，CGI 是 一 个 用 
于 在 因特网 中 传输 数据 的 预定 义 系统 。 当 前 的 脚本 语言 隐藏 其 细节 ， 所 以 你 可 以 轻易 地 按 需 
得 到 数据 。 

composite key: 复合 码 一 一 包括 不 止 一 列 的 主 码 。 表 示 列 之 间 的 多 对 多 关系 。 

composition association: 组 合 关联 一 一 在 这 种 关系 里 , 对象 由 一 组 其 他 对 象 构成 。 例 如 ， 
自行 车 由 零件 构成 。 在 UML 中 ， 小 的 实心 鞭 形 用 来 指示 关联 端 。 

computer-aided software engineering (CASE)， 计算机 辅助 软件 工程 一 “为 支持 计算 
机 系统 的 分 析 和 开发 而 设计 的 计算 机 程序 。 这 些 程序 有 助 于 创建 、 存 储 和 分 享 图 表 和 数据 定 
义 。 某 些 版 本 还 能 分 析 现 有 代码 并 生成 新 代码 。 

concatenate; 连接 一 一 把 一 个 串 接 到 另 一 个 串 尾 的 程序 操作 。 例 如 ， 姓 及 ”,” 及 名 就 可 
能 产生 “Smith, John”。 

concatenated key ;连接 码 一 一 参见 Composit key。 

concurrent access: 并 发 访问 一 一 同时 对 相同 数据 执行 两 个 (或 多 个 ) 操作 。DBMS 必 
须 把 操作 顺序 化 ， 这 样 一 些 改变 才 不 会 丢失 。 

confidence， 置 信和 度 一 一 在 关联 规则 的 数据 挖 所 中， 规则 强度 的 度量 由 包含 A 项 的 事务 同 
时 也 包含 B 项 的 百分比 计算 得 到 。 也 就 是 A 已 经 在 篮子 里 时 ，B 也 在 的 概率 。 

consistency, application ，( 应 用 程序 ) 一 致 性 一 一 通过 一 直 使 用 相同 的 特性 、 颜 色 和 命 
令 来 达到 让 应 用 更 易 使 用 的 目标 。 现 代 应 用 都 寻求 在 共同 设计 向 导 下 达到 一 致 性 。 

consistency, transaction，( 事 务 ) 一 致 性 一 一 事务 的 要 求 ， 它 指定 了 在 更 改 提交 时 所 有 
的 数据 都 必须 内 部 保持 一 致 ， 并 且 可 以 由 应 用 来 检查 验证 。 

constraint: 约束 一 一 在 SQL 中 ， 约 束 是 强加 在 数据 上 的 规则 。 例 如 ， 可 能 有 一 些 列 声明 
了 主 码 和 外 码 约束 ， 这 实际 上 就 限制 了 输入 到 表 中 的 数据 。 其 他 商业 规则 也 可 以 形成 约束 ， 
例如 Price>0。 

context-sensitive help: 上 下 文 相关 帮助 一 一 被 过 滤 以 适合 用 户 正在 执行 的 操作 的 帮助 
消息 。 

context-sensitive menu: 上 下 文 相关 菜单 一 一 随 着 用 户 选 择 的 对 象 不 同 而 不 断 改 变 的 
菜单 。 

control break: 控制 中 断 一 一 包含 分 组 数据 的 报表 使 用 控制 中 断 来 分 离 各 组 。 这 个 中 断 在 
标识 每 组 成 员 的 码 变 量 上 定义 。 

controls: 控件 一 一 放置 在 表单 上 的 小 组 件 的 统称 。 典 型 的 控件 包括 文本 框 、 组 合 框 和 
标签 。 

correlated subquery: 关联 子 查询 一 一 必须 为 主 查询 的 每 一 行 重新 求 值 的 子 查询 ， 运 行 
起 来 可 能 会 非常 地 慢 。 常 常 可 以 避免 关联 子 查询 ， 方 法 是 创建 临时 表 并 在 子 查询 中 使 用 。 

-CREATE DOMAIN 一 一 SQL 数据 定义 命令 ， 用 来 创建 由 现 有 数据 域 组 合 起 来 的 新 数据 域 。 

CREATE SCHEMA 一 一 SQL 数据 定义 命令 ， 用 来 创建 表 的 新 逻辑 表 分 组 。 在 一 些 系 统 中 ， 
它 和 创建 新 数据 库 是 一 样 的 。 这 个 命令 在 Oracle 和 SQL Server 中 不 可 用 。 
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CREATE TABLE 一 一 SQL 数据 定义 命令 ， 用 来 创建 新 表 。 这 个 命令 常常 由 程序 生成 。 

CREATE VIEW 一 一 SQL 命令 ， 用 来 创建 新 视图 或 保存 查询 。 

Cross JOIN: 交叉 连接 一 一 当 疫 有 指定 两 个 表 的 连接 条 件 时 就 会 发 生 。 第 一 个 表 的 每 一 
行 要 与 第 二 个 表 的 每 一 行进 行 匹 配 ， 也 称 “ 笛 卡 儿 积 "。 应 该 尽量 避免 这 种 操作 。 

crosstab : 交叉 表 一 一 一 种 特殊 的 SQL 查询 (并 不 是 所 有 的 系统 都 提供 )， 它 基于 两 组 数 
据 创 建 一 个 列表 的 输出 。Access 使 用 TRANSFORM 命 令 创 建交 叉 表 。 

cursor: 游标 (1) 在 图 形 化 环境 下 ， 指 针 的 当前 位 置 。(2) 跟踪 一 个 表 中 各 行 的 指 
针 ， 一 次 可 以 激活 数据 中 的 一 行 。 

cylinder: 柱 面 一 一 磁盘 驱动 器 划分 成 表示 磁道 一 部 分 的 柱 面 (或 扁 区 )。 

data administration， 数 据 管理 一 一 在 整个 公司 内 定义 数据 一 致 性 所 必需 的 计划 和 协调 。 

data administrator (DA) : 数据 管理 员 一 一 管理 一 个 公司 数据 资源 的 人 。DA 负 责 数据 完 
整 性 、 一 致 性 和 集成 性 。 

data definition language (DDL): 数据 定义 语言 一 一 用 来 定义 数据 的 命令 集 ， 例 如 
CREATE TABLE。 图 形 界面 常常 更 容易 使 用 ， 但 用 程序 创建 新 表 时 ， 数 据 定 义 命 令 很 有 用 。 

data device: 数据 设备 一 一 为 保存 数据 库 的 表 、 索 引 和 回 滚 数据 而 分 配 的 存储 空间 。 参 
见 tablespace。 

data dictionary: 数据 字典 一 一 保存 所 有 数据 表 的 定义 ， 描 述 将 要 存储 的 数据 类 型 。 

data independence: 数据 独立 性 一 一 把 数据 从 程序 中 分 离 出 来 ， 常 常 可 以 在 不 修改 程序 
的 情况 下 更 改 数据 定义 。 

data integrity: 数据 完整 性 一 一 保持 数据 的 正确 性 ， 意 思 是 没有 错误 ， 而 且 数 据 要 反映 业 
务 的 真实 状态 。DBMS 指 定 约束 或 规则 来 维护 完整 性 。 例 如 价格 必须 总 是 大 于 0 的 。 

data _ manipulation language (DML)， 数据 操纵 语言 一 一 用 来 修改 数据 的 命令 集 。 参 见 
INSERT、DELETE 和 UPDATE。 

data mining: 数据 挖掘 一 一 在 数据 库 中 搜索 未 知 模式 和 信息 。 其 工具 包括 统计 分 析 、 模 
式 匹 配 技术 以 及 数据 分 割 分 析 、 分 类 分 析 、 关 联 规 则 和 聚 类 分 析 等 。 

data normalization: 数据 规范 化 一 一 创建 表现 良好 的 表 集 合 以 有 效 存 储 数据 、 最 小 化 元 
余 和 确保 数据 完整 性 的 全 过 程 参见 第 1、 第 2 和 第 3 范式 。 

data replication， 数据 复 制 一 一 分 布 式 系统 中 ， 在 若干 个 服务 器 上 放置 数据 的 副本 ， 以 减 
少 全 局 的 传输 时 间 和 代价 。 

data type: 数据 类 型 一 一 可 以 用 一 列 保存 的 一 类 数据 。 每 个 DBMS 都 有 一 些 事先 定义 好 
的 系统 域 ( 整 型 、 浮 点 型 、 字 符 串 等 )。 一 些 系统 支持 由 其 他 数据 类 型 组 合 而 来 的 用 户 自 定 

data volume: 数据 量 一 一 数据 库 大 小 的 估计 值 。 对 每 张 表 来 说 ,通过 把 估计 的 行 数 乘 以 
每 行 的 平均 数据 长 度 而 计算 得 到 。 

data warehouse: 数据 仓库 一 一 为 管理 查询 而 优化 的 专用 数据 库 。 数 据 从 联机 事务 处 理 
系统 中 抽取 出 来 ， 经 过 清洗 ， 然 后 为 搜索 和 分 析 进 行 优 化 。 通 常 由 并 行 处 理 机 和 RAID 存 储 所 
支持 。 

database: 数据 库 一 一 用 标准 格式 存储 的 数据 集 ， 设 计 来 为 多 个 用 户 所 共享 。 也 是 为 特定 
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商业 情况 而 建 的 表 集 合 。 

database administration: 数据 库 管 理 一 一 创建 和 运行 数据 库 的 技术 。 其 基本 任务 是 性 能 
监控 、 备 份 与 恢复 以 及 分 配 和 控制 安全 性 。 

database administrator (DBA) ， 数据 库 管理 员 一 一 在 管理 特定 DBMS 方 面 受 过 训练 的 专 
家 。DBA 要 经 过 安装 、 配 置 和 操纵 DBMS 的 细节 方面 的 训练 。 

database cursor: 数据 库 游 标 一 一 在 定义 SELECT 语句 的 程序 设计 语言 中 创建 的 变量 ， 
一 次 指向 一 行 数 据 。 该 行 数 据 可 以 用 程序 语言 提取 或 编辑 。 

database engine: 数据 库 引 擎 -一 -DBMS 的 核心 ， 它 负责 存储 、 提 取 和 更 新 数据 。 

database management system (DBMS): 数据 库 管理 系统 一 一 定义 数据 库 、 存 储 数据 、 
支持 查询 语言 、 生 成 报表 以 及 创建 数据 输入 屏幕 的 软件 。 


2Z— 











可 能 少 的 空间 显示 数据 。 
deadlock:， 死 锁 一 一 当 两 个 (或 多 个 ) 进程 都 封锁 另 一 个 所 需要 的 数据 时 发 生 的 情况 。 
default value ; 默认 值 一 一 自动 显示 和 输入 的 值 ， 用 来 在 数据 输入 中 节省 上 时间。 


Z— 











WHERE 指定 哪些 行 应 删除 。 

deletion anomaly:， 删除 异常 一 一 从 一 个 不 属于 第 三 范式 的 表 中 删除 数据 时 引发 的 问题 。 
例如 ， 如 果 所 有 的 客户 数据 都 存放 在 每 个 订单 里 ， 删 除 订单 时 ， 就 丢失 了 所 有 相关 客户 的 数据 。 

DeMorgan's law: 德 摩根 定律 一 一 一 个 代数 定律 ， 意 思 是 : 要 否定 含 AND 或 OR 连接 词 的 
条 件 ， 就 需要 和 否定 每 一 个 子 条 件 并 交换 连接 词 。 也 就 是 说 ，AND 变 成 OR， 反 之 亦 然 。 

dependence: 依赖 一 一 数据 规范 化 中 的 问题 。 如 果 属 性 A 的 值 的 改变 受 属性 B 改 变 的 影 
响 ， 就 说 A 依 赖 于 B。 例 如 ， 客 户 的 名 字 依 赖 于 客户 的 ID (每 位 雇员 都 有 一 个 特定 的 名 字 )。 
另 一 方面 ， 客 户 的 名 字 并 不 依赖 于 订单 的 ID。 每 次 订购 货物 时 客户 的 名 字 并 不 改变 。 

derived class: 派生 类 一 一 用 另 一 个 类 经 扩展 而 得 到 的 类 。 程 序 员 仅 需要 定义 新 的 属性 和 
方法 。 其 他 所 有 的 内 容 都 从 更 高 级 别 的 类 中 继承 而 来 。 参 见 inheritance。 . 

DESC 一 一 在 SQL SELECT ... ORDER BY 语句 中 的 修饰 词 ， 指 定 是 递减 排序 (如 2Z...A)。 
ASC 可 以 用 做 递增 排序 ， 但 它 是 默认 的 ， 所 以 不 需要 指定 。 

dimension， 维 一 一 OLAP 立 方 体 的 一 个 属性 ， 用 来 分 组 和 检索 数据 。 

direct access: 直接 存 取 一 一 一 种 数据 存储 方法 : 物理 地 址 由 逻辑 码 值 计算 得 到 。 数 据 可 
以 不 经 检索 地 存储 和 提取 。 

direct manipulation of objects， 对 象 的 直接 操作 一 种 图 形 化 界面 的 方法 ， 设计 来 模 
仿真 实 世 界 的 行为 。 例 如 ， 通 过 拖 搜 图 标 从 一 个 地 方 把 文件 复制 到 另 一 个 地 方 。 

disaster plan， 灾难 应 急 计 划一 一 针对 突 发 事件 而 创建 的 计划 ， 当 灾难 袭击 计算 机 系统 时 
使 用 。 计 划 包 括 了 备份 的 离线 存储 、 人 员 通 知 以 及 在 一 个 安全 站 点 建立 操作 。 

DISTINCT 一 一 在 SELECT 语句 中 用 于 从 输出 中 移 除 重复 行 的 SQL 关键 字 。 

distributed database， 分 布 式 数据 库 一 一 运行 在 两 个 或 多 个 利用 网 络 连 接 起 来 并 共享 数 
据 的 计算 机 上 的 多 个 独立 的 数据 库 。 这 些 数据 库 通常 处 在 不 同 的 物理 场地 ， 每 个 数据 库 都 由 
独立 的 DBMS 控 制 。 
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dockable toolbar: 可 停靠 的 工具 栏 一 一 用 户 可 以 拖 到 应 用 窗口 任意 位 置 的 工具 栏 。 通 常 
可 以 自 定义 选项 和 按钮 ， 以 执行 特定 的 任务 。 

domain-key normal form (DKNF); 域 - 码 范式 一 一 设计 数据 库 的 最 终 且 标 。 每 张 表 代 
表 了 一 个 主题 ， 并 且 所 有 的 商业 规则 都 用 域 约束 和 码 关系 来 表达 。 即 ， 所 有 的 商业 规则 都 用 
表 规 则 显 式 描述 。 

drag-and-drop; 拖 放 一 一 一 种 图 形 界面 技术 ， 它 支持 定义 这 样 的 动作 : 即 按 下 鼠标 并 保 
持 ， 拖 动 图 标 ， 然 后 把 图 标 放 到 一 个 新 对 象 上 。 

drill down: 下 钻 一 一 由 显示 的 综合 性 数据 得 到 更 多 细节 的 操作 。 常 用 于 在 数据 仓库 或 
OLAP 应 用 中 检查 数据 。 参 见 roll up。 

drive head: 磁头 一 一 在 磁盘 上 读 取 和 写 入 数据 的 机 械 设 备 。 现 代 驱 动 器 都 有 好 几 个 磁头 。 

DROP TABLE 一 一 SQL 数据 定义 命令 ， 用 于 从 数据 库 中 完全 删除 表 一 一 包括 定义 。 请 保 
守 使 用 。 

dual-key encryption : 双 密 钥 加 密 一 一 使 用 两 个 不 同 密 钥 的 加 密 技术 : 一 个 私 钥 和 一 个 公 
钥 。 公 钥 公 开 ， 任 何人 都 可 以 得 到 。 要 发 送 加 密 的 消息 给 某 人 ， 就 用 那个 人 的 公 钥 。 另 一 面 ， 
只 有 那个 人 的 私 钥 才 能 解密 消息 。 先 用 你 的 私 钥 加 密 消 息 也 可 以 证 明 是 你 写 了 那 条 消息 。 

durability: 持久 性 一 一 事务 的 要 素 之 一 ， 它 指定 当 事 务 提交 时 ， 所 有 的 更 改 都 必须 永久 
保存 ， 即 使 有 硬件 或 系统 故障 。 : 

edit， (微软 DAO 命 令 ) 一 一 微软 用 来 在 当前 行 修改 数据 的 DAO 命 令 。 

electronic data interchange (EDI) ， 电子 数据 交换 一 一 在 含有 诸如 供应 商 、 客 户 和 银行 
等 外 部 代理 的 网 络 上 交换 数据 。 

encapsulation : 封装 一 一 面向 对 象 编 程 中 ， 在 公共 类 里 定义 属性 和 方法 的 技术 。 例 如 ， 
Employee (雇员 ) 类 的 所 有 属性 和 功能 放 在 一 起 。 其 他 对 象 可 以 通过 引用 Employee 对 象 来 使 
用 这 些 属 性 和 方法 。 - 

encryption: 加 密 一 一 用 一 个 密码 值 将 数据 编码 ， 使 数据 变 得 不 可 读 。 当 今 两 种 常用 的 加 
密 方法 是 ; 单 密 钥 加 密 (如 DES) 和 双 密 钥 加 密 (如 RSA)。 

entity:， 实体 一 一 现实 世界 中 我 们 希望 识别 和 跟踪 的 一 个 项 。 

entity-relationship diagram (ERD) : 实体 一 关系 图 一 一 展示 商务 实体 之 间 关 联 (关系 ) 
的 图 。 在 UML 中 ， 类 图 显示 了 相似 的 关系 。 

equi-join; 等 值 连接 -一 -SQL 中 条 件 为 等 式 的 连接 (JOIN)。 两 张 表 中 的 行当 列 完全 匹配 
时 和 做 连 接 。 等 值 连接 是 最 常见 的 JOIN 条 件 ， 跟 另 一 张 表 没有 任何 匹配 的 行将 不 显示 。 

EXCEPT 一 一 从 两 个 SELECT 语句 中 检查 行 的 SQL 操作 符 。 它 返回 第 一 个 语句 的 所 有 行 ， 
但 除去 第 二 个 语 名 将 要 返回 的 那些 行 。 有 时 候 实 现 为 SUBTRACT 命 令 。 参 见 UNION。 

EXISTS 一 一 用 来 确定 子 查 询 是 否 返 回 一 些 数 据 行 的 SQL 关 键 字 。 

expert system (ES) : 专家 系统 一 一 让 新 手 可 以 像 专家 那样 做 出 决策 的 系统 ， 包 含 数据 
和 规则 的 基础 知识 。 

extensible markup language (XML) : 可 扩展 标记 语言 一 一 一 个 基于 标签 的 符号 系统 ， 
用 于 给 数据 分 配 名 字 和 结构 。 主 要 是 为 不 同系 统 之 间 传 输 数 据 而 设计 的 。 

extraction, transformation, and transportation (ETT) ， 抽取 、 转 化 和 传送 一 一 用 现 有 文 
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件 或 数据 库 组 装 数据 仓库 的 三 个 步骤 。 抽 取 表示 选择 想 要 的 数据 。 转 化 通常 是 最 难 的 步骤 ， 
而 且 要 让 数据 一 致 。 传 送 意味 着 数据 必须 在 网 络 上 物理 地 移动 到 数据 仓库 中 。 

fact table: 事实 表 一 一 存储 将 要 在 OLAP 立 方 体 中 表达 的 数据 表 或 查询 。 

feasibility study: 可 行 性 研究 一 一 对 建议 系统 的 问题 、 目 标 及 预期 成 本 的 快速 检查 。 其 
目的 是 确定 存在 的 问题 是 否 能 被 计算 机 系统 有 效 地 解决 。 

feedback: 反馈 一 一 一 种 设计 特性 ， 当 任务 完成 或 错误 发 生 时 ， 应 用 向 用 户 提供 信息 。 
反馈 可 能 以 多 种 形式 提供 (如 消息 、 可 见 信 号 或 发 声 提 醒 等 )。 

FETCH 一 一 在 SQL 游标 编程 中 用 到 的 命令 ， 目 的 是 把 下 一 行 的 数据 提取 到 内 存 中 。 

first normal form (1NF): 第 一 范式 一 一 一 个 表 处 于 第 一 范式 ， 是 指 当 里 面 设 有 重复 分 组 
时 。 每 一 单元 格 只 能 包含 一 个 值 。 例 如 ， 有 多 少 项 可 以 放 进 Order (订单 ) 表 ? 项 有 重复 的 话 ， 
就 必须 分 成 不 同 的 表 。 

fixed-width storage: 定 宽 存储 一 一 每 列 都 用 固定 的 字 节 来 存储 数据 的 每 一 行 。 

fixed-with-overflow storage: 带 溢出 的 定 宽 存储 一 一 用 有 限 的 字 节 存储 数据 行 的 一 部 分 ， 
并 把 多 余 的 数据 移 到 洲 出 区 去 。 

focus: 焦点 一 一 在 窗口 环境 中 ， 当 可 以 接收 按键 消息 时 就 说 表单 或 控件 保持 着 焦点 。 通 常 
都 是 高 亮 显示 的 。 

For Each ... Next 一 一 VBA 中 的 选 代 命令 ， 可 以 自动 识别 组 中 对 象 ， 并 在 该 集合 上 应 用 某 
个 操作 。 当 处 理 电子 数据 表格 时 尤其 有 用 。 

foreign key :外 码 一 一 表 中 的 一 列 ， 它 是 另 一 张 表 的 主 码 ， 但 它 不 必 是 第 一 张 表 的 码 。 
例如 ， 在 Order (订单 ) 表 中 ，CustomerID (客户 ID) 就 是 个 外 码 ， 因 为 它 是 Costomer (客户 ) 
表 的 主 码 。 

forms generator: 表单 生成 器 一 一 让 你 在 屏幕 上 建立 输入 表单 的 DBMS 工 具 。 

fourth normal form (4NF): 第 四 范式 一 一 不 能 有 码 列 之 间 的 隐 含 依赖 。 当 一 个 码 决 定 着 
两 个 不 同 但 独立 的 属性 时 ， 就 存在 了 多 值 依赖 。 把 表 分 开 ， 让 这 两 个 依赖 显 形 。 

FROM 一 一 确定 查询 从 哪些 表 中 获取 数据 的 SQL SELECT 子 句 ， 也 用 于 含 JOIN 或 INNER 
JOIN 语句 的 连接 中 。 | 

FULL JOIN 一 一 一 种 连接 运算 ， 其 运算 结果 为 两 个 表 之 闻 所 有 匹配 的 行 ， 加 上 左 表 中 没 
有 匹配 的 行 和 右 表 中 没有 匹配 的 行 。 这 个 运算 不 常 使 用 ， 参 见 LEFT JOIN 和 RIGHT JOIN。 

function ， 函 数 一 一 用 来 执行 特定 计算 的 过 程 。 函 数 和 子 例 程 的 区 别 在 于 函数 要 返回 一 
个 特定 值 (不 包括 参数 )。 

generalization association: 概括 关联 一 一 由 概要 类 发 起 的 一 种 类 间 关 系 。 更 详细 的 类 从 
它 衍生 而 来 ， 并 继承 了 更 高 级 别 类 的 属性 和 方法 。 

geocode: 经 纬度 代码 一 一 给 数据 集 指 定 其 地 点 的 经 度 和 纬度 坐标 。 

geographic information system (GIS)， 地 理 信 息 系 统一 一 用 来 识别 和 显示 商业 数据 与 
地 点 之 间 关 系 的 系统 ， 是 在 数据 库 环境 中 使 用 对 象 的 一 个 很 好 的 例子 。 

GRANT 一 一 赋予 某 人 对 特定 表 或 查询 以 权限 的 SQL 命令 。 

graphics interchange file (GIF): 图 形 交换 文件 一 一 存储 图 形 图 像 的 一 种 标准 方法 ， 通 
常用 于 在 因特网 上 共享 图 片 。 
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group break: 分 组 中 断 一 一 把 数据 分 成 组 的 报表 ， 分隔 点 就 叫做 “中 断 ”， 也 叫做 控制 
中 斯。 

GROUP BY 一 一 对 组 中 每 一 项 计算 聚集 值 的 SQL SELECT 子 句 。 例 如 ，SELECT 
Department, SUM (Salary) FROM Employee GROUP BY Department; 表示 对 每 一 部 门 计算 并 
列 出 雇员 薪水 的 总 和 。 

HAVING 一 一 随 GROUP BY 语句 使 用 的 SQL 子 句 ， 它 限制 只 输出 那些 符合 特定 条 件 的 组 。 

heads-down data entry; 育 打 一 一 触摸 式 的 打字 员 ， 只 关 广 输入 数据 ， 不 看 屏幕。 为 这 
种 任务 设计 的 表单 应 该 最 小 化 按键 ， 并 使 用 声音 提示 。 

Help system， 帮助 系统 一 一 一 种 用 于 显示 、 排 列 和 搜索 帮助 文档 的 系统 。 开 发 者 需要 以 
特定 的 格式 编写 帮助 文档 ， 然 后 使 用 帮助 文档 编译 器 来 生成 最 终 的 帮助 文件 。 

hidden dependency: 隐 含 依赖 一 一 由 不 在 表 结 构 中 显示 的 商业 规则 指定 的 依赖 。 通 常 意 
味 着 表 应 该 进一步 规范 化 ， 并 在 Boyce-Codd 范 式 或 第 四 范式 上 存在 问题 。 

hierarchical database， 层次 数据 库 一 一 一 种 过 时 的 DBMS 类 型 ， 用 可 以 快速 地 自 顶 向 
下 搜索 的 层次 结构 来 组 织 数据 ， 例 如 Customer (客户 ) 一 Order (订单 ) 一 OrderItem ( 订 
购 项 ) 。 

horizontal partition : 水 平 划分 一 一 根据 数据 行 把 表 划 分 成 不 同 的 组 。 不 常用 的 行 移 到 较 
慢 、 较 便宜 的 存储 设备 中 。 

hot site ， 热 站 一 一 灾难 备份 专家 那里 可 供出 租 的 设施 。 热 站 包含 所 有 的 动力 、 道 信 设 施 
以 及 公司 运行 所 必须 的 计算 机 。 在 灾难 事件 里 ， 公 司 收集 备份 数据 ， 通 知 员工 ， 并 把 业务 操 
作 转 移 到 热 站 。 

human factors design; 人 性 化 设计 一 一 把 计算 机 系统 设计 得 适合 人 类 使 用 。 

hypertext link: 超 文 本 链接 一 一 超 文本 链接 (例如 Web) 文档 包含 文本 和 图 形 ， 里 面 有 可 
以 得 到 新 页 面 的 链接 。 点 击 链 接 是 浏览 互联 网 和 获得 更 多 信息 的 主要 手段 。 

hypertext markup language (HTML): 超 文本 标记 语言 一 一 一 种 显示 标准 ， 几 于 创建 在 
因特网 上 共享 的 文档 。 许 多 生成 器 都 可 以 从 标准 文字 处 理 文件 的 文件 中 创建 HTML 文 档 。 

icon ， 图 标 一 一 一 些 思想 或 对 象 的 小 图 片 表示 。 一 般 情 况 下 ， 用 于 图 形 用 户 界面 来 执行 
命令 和 操纵 基本 对 象 。 

IN 一 一 SQL WHERE 子 名 的 操作 符 ， 一般 情况 下 会 和 子 查询 一 起 使 用 。 当 选择 的 项 和 列表 
中 的 某 一 项 匹配 时 ， 返 回 符合 这 个 匹配 的 数据 。 例 如 ，WHERE ItemID IN (115, 235,，536) 
返回 ItemID 是 115、235 或 536 的 数据 行 。 一 般 来 说 ， 括 号 里 经 常 是 另 一 个 SELECT 语句 。 

index: 索引 一 一 原始 表 中 一 组 码 值 的 有 序列 表 ， 含 有 指向 每 一 行 数据 的 指针 。 用 于 加 速 
搜索 和 数据 获取 。 

indexed sequential access method (ISAM): 索引 顺序 存 取 法 一 一 一 种 数据 存储 方法 ， 
和 单纯 的 顺序 检索 比 ， 依 靠 索 引 来 更 快 地 检索 和 提取 数据 。 

inequality join ， 不 等 连接 一 一 不 使 用 相等 操作 符 ， 而 用 不 等 (大 于 或 小 于 ) 来 执行 比较 
的 SQL 连接 。 根 据 数据 范围 把 数据 分 类 存放 时 比较 有 用 。 

inheritance : 继承 一 一 在 面向 对 象 设 计 中 ， 定 义 源 自 更 高 级 别 类 的 新 类 的 能 力 。 新 类 继 
承 所 有 更 高 一 级 的 属性 和 方法 ， 所 以 程序 员 只 需要 定义 新 类 特有 的 属性 和 方法 。 
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INNER JOIN 一 一 SQL 的 等 值 连接 条 件 ， 两 个 表 中 的 行 在 列 精确 匹配 时 的 连接 。 这 是 最 常 
用 的 连接 情况 ， 和 另 一 张 表 没有 匹配 的 行 不 显示 。 

InputBox: 输入 框 一 一 一 个 预定 义 的 简单 Windows 表 单 ， 可 能 会 用 于 从 用 户 获取 一 条 数据 。 
但 最 好 不 要 使 用 它 ， 而 是 创建 你 自己 的 表单 。 

INSERT 一 一 插入 数据 到 表 中 的 两 个 SQL 命令 。 一 个 命令 用 于 一 次 插入 单独 一 行 ， 另 一 个 
命令 从 某 个 查询 中 复制 选中 的 数据 并 作为 新 数据 行 追 加 到 目标 表 里 。 

insertion anomaly: 插入 异常 一 一 试图 把 数据 插入 到 不 属于 第 三 范式 的 表 中 而 引发 的 问 
题 。 例 如 ， 如 果 发 现 自己 在 重复 输入 相同 的 数据 (例如 某 个 客户 的 地 址 ) ， 那 么 这 个 表 就 很 可 
能 需要 重新 定义 。 

Internet: 因特网 一 一 一 组 松散 连接 的 、 在 世界 范围 内 交换 信息 的 计算 机 及 其 网 络 。 计 算 
机 的 所 有 者 制作 供 其 他 用 户 使 用 的 文件 和 信息 。 

INTERSECT 一 一 两 个 SELECT 语句 中 针对 数据 行 的 集合 操作 ， 只 有 两 个 语句 共有 的 行 才 
会 提取 。 参 见 UNION。 

intranet: 内 联网 一 一 使 用 互联 网 技术 共享 数据 的 公司 内 部 网 络 。 

isolation ， 隔 离 性 一 一 事务 的 性 质 ， 即 系统 必须 让 每 个 事务 都 感觉 它 是 独立 运行 的 ， 且 不 
存在 并 发 访问 问题 。 

isolation level:， 隔离 等 级 一 一 在 事务 中 用 来 指定 锁 的 属性 。 至 少 ， 用 来 指定 乐观 锁 还 是 
悲观 锁 。 有 些 系统 还 支持 中 间 级 别 。 

iteration :和 迭代 一 一 使 代码 的 一 部 分 重复 执行 ， 例 如 循环 扫描 数据 的 每 一 行 这 种 需求 。 典 
型 的 命令 包括 Do...loop 和 For...Next。 

Java: Java 程 序 设计 语言 一 一 由 Sun Microsystems 公 司 开发 的 程序 设计 语言 ， 声 称 能 够 不 
加 修改 地 运行 在 多 种 计算 机 平台 上 。Java 最 初 设计 为 幅 入 式 系统 的 控制 语言 ， 而 现在 的 目标 是 
因特网 应 用 。 

Java 2 enterprises edition (J2EE) ，Java 2 企业 版 一 一 基于 服务 器 构建 复杂 应 用 的 后 端 
系统 ， 它 基于 Java 但 包含 一 个 完整 的 编程 环境 。 

JDBC 一 一 有 时 称 为 Java 数 据 库 连接 。 连 接 Java 代 码 到 数据 库 的 方法 集 。 与 ADO 的 目的 相 
似 ， 但 仅 适 用 于 Java 程 序 。 

JOIN 一 一 当 从 不 止 一 个 表 中 提取 数据 时 ， 各 表 必 须 按 一 定 的 数据 列 连接 起 来 。 参 见 
INNER JOIN 和 LEFT JOIN 。 

latency: 等 待 时间 一 一 系统 的 时 间 延 迟 。 在 基于 Web 的 系统 里 ， 延 迟 是 由 慢 速 的 网 络 连 
接 造 成 的 。 长 时 间 的 下 载 造成 了 较 大 的 等 待 时 间 ， 从 而 会 导致 更 多 的 服务 器 冲突 。 

LEFT JOIN 一 一 包含 了 “ 左 ” 表 所 有 的 行 (即使 “ 右 ” 表 中 没有 匹配 的 行 ) 的 OUTER 
JOIN。 缺 失 的 值 显 示 为 Null。 参 见 RIGHT JOIN 和 INNER JOIN 。 左 表 和 右 表 是 按 表 出 现 的 先 
后 顺序 定义 的 ， 左 表 是 第 一 个 表 。 

lifetime :生命 期 一 一 程序 变量 保持 有 效 的 时 间 长 度 。 例 如 ， 在 子 例 程 中 创建 的 程序 变量 ， 
当 子 例 程 执行 时 就 创建 ， 而 退出 时 销毁 。 全 局 变量 对 模块 内 的 所 有 过 程 一 直 有 效 。 

| 放 ， 提升 度 一 一 由 关联 规则 贡献 的 潜在 收益 (相对 于 没有 规则 时 的 购买 而 言 )。 

LIKE 一 一 用 来 比较 字符 串 值 的 SQL 模 式 匹 配 操作 符 。 其 标准 使 用 百 分 号 (%) 匹配 任意 数 
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目的 字符 ， 下 划 线 (_) 匹配 单一 字符 。 有 些 系统 (例如 Access) 使 用 星 号 (*) 和 问号 (? ) 
作为 替代 百 分 号 (%) 和 下 划 线 (_) 的 替代 符号 。 

list box; 列表 框 一 一 显示 选择 列表 的 表单 控件 。 这 个 列表 一 直 显 示 着 ， 并 占据 固定 大 小 
的 屏幕 空间 。 

list of values (LOV) : 值 列 表 一 一 在 Oracle 表 单 上 选择 数据 的 重要 技术 。 这 种 Oracle 表 单 
维护 了 可 从 文本 框 选取 的 数据 的 一 部 分 且 缓存 的 列表 ， 用 来 替代 组 合 框 或 选择 框 。 由 于 只 给 
用 户 发 送 列 表 的 一 部 分 ， 所 以 在 分 布 式 数据 库 中 尤其 有 用 。 

local area network (LAN) : 局 域 网 一 一 较 小 地 理 区 域内 的 个 人 计算 机 的 集合 ， 所 有 的 网 
络 组 件 都 由 一 个 公司 拥有 或 控制 。 

local variable: 局 部 变量 定义 在 子 例 程 内 的 变量 ， 只 能 在 子 例 程 内 部 访问 该 变量 ， 
外 部 过 程 不 能 访问 它 。 

logic: 逻辑 一 一 定义 了 程序 目的 和 结构 的 逻辑 表述 。 可 以 用 独立 于 程序 语法 的 伪 码 来 描 
述 。 边 辑 结 构 包 括 循环 、 条 件 、 子 例 程 和 输入 /输出 命令 等 。 

logical security， 逻辑 安全 一 一 确定 哪些 用 户 应 该 对 哪些 数据 有 访问 权 。 它 防止 三 种 数据 
问题 : (1) 未 授权 的 泄漏 ，(2) 未 授权 的 更 改 ， 以 及 (3) 未 授权 的 截留 。 

loop: 循环 一 一 每 个 循环 都 必须 有 开始 和 结束 条 件 ， 以 及 递增 循环 变量 值 的 过 程 。 参 见 
iteration 。 

market basket analysis ， 购 物 复 分 析 一 一 参见 association rules 。 

masterdetail; 主 从 关系 一 一 常见 于 商业 表单 中 的 一 对 多 关系 ， 就 是 主 表单 (如 Order) 
为 显示 主 组 件数 据 ， 子 表单 (如 Order Item) 显示 详细 数据 。 有 时 也 叫 父 子 关系 。 

measure: 度量 一 一 OLAP 立 方 体 中 显示 的 数值 数据 。 

menu: 菜单 一 一 一 系列 分 组 排列 的 应 用 命令 ， 通 常 在 工具 栏 上 。 它 为 经 常 使 用 的 命令 提 
供 引 用 方法 ， 并 且 突 出 应 用 的 结构 。 

metadata ， 元 数据 一 一 有 关 数 据 的 数据 ， 或 者 说 是 数据 表 和 各 列 的 描述 。 元 数据 通常 保 
存在 数据 字典 里 。 

method; 方法 一 一 类 可 以 执行 的 函数 或 操作 。 例 如 ，Customer (客户 ) 类 无 论 什么 时 候 
给 数据 库 中 滩 加 新 客户 对 象 时 ， 都 会 调用 AddNew 方 法 。 

model form : 模式 框 一 一 一 个 优先 出 现在 屏幕 上 的 框 ， 强 制 用 户 在 继续 执行 当前 进程 前 
必须 先 处 理 它 。 应 该 避免 使 用 模式 框 ， 因 为 它 妨 碍 用 户 的 操作 。 

module (or package); 模块 (或 包 ) 一 一 子 例 程 的 集合 ， 常 常 和 通用 的 目标 有 关 。 

MsgBox: 消息 框 一 一 Windows 中 一 个 预定 义 的 方法 ， 它 在 屏幕 上 显示 简要 消息 并 展示 给 
用 户 几 种 选择 。 由 于 是 对 话 框 且 打扰 用 户 ， 所 以 应 该 尽量 少 用 。 

multiplicity: 重复 度 表示 关联 数量 的 UML 术 语 。 它 用 一 个 最 小 值 、 一 个 省 略 号 〈…) 
和 一 个 最 大 值 或 表示 许多 的 星 号 (* ) 显示 在 关联 线 上 。 例 如 ， 客 户 可 以 发 放 0 到 多 个 订单 ， 
所 以 重复 度 是 (0...*)。 

n-ary association: 多 重 关联 一 一 三 个 或 多 个 类 之 间 的 关联 。 它 在 UML 类 图 中 用 菱形 表 
示 。 这 个 术语 由 扩展 英文 单词 而 来 : unary 表 示 1，binary 表 示 2，ternary 表 示 4， 所 以 N-ary 表 示 
许多 。 
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naming conventions: 命名 惯例 一 一 程序 团队 应 该 以 一 致 的 格式 来 命名 变量 和 控件 。 一 
个 常用 的 方法 就 是 使 用 3 个 字母 的 前 缀 表示 变量 类 型 ， 然 后 附 上 描述 名 。 

nested conditions; 艇 套 条 件 一 一 放置 在 其 他 条 件 语 句 内 部 的 条 件 语句 。 例 如 ，I (x > 0) 
Then .… If (y < 4) Then .…。 有 些 嵌 套 条 件 可 以 用 Case 语 句 代 替 。 

nested query: 和 从 套 查询 一 一 参见 subquery 。 

network database: 网 状 数据 库 一 一 一 种 过 时 的 DBMS 类 型 ， 它 通过 支持 实体 之 间 的 多 重 
连接 而 扩展 了 层次 型 数据 库 。 网 状 数据 库 表 现 为 所 有 的 连接 都 必须 被 索引 支持 。 

normalization， 规 范 化 一 一 参见 data normalization 。 

NOT 一 一 SQL 的 否定 操作 符 。 在 WHERE 子 句 中 用 于 对 一 个 条 件 的 结果 求 反 。 参 见 DeMor- 
gan’s law。 

NotinList 一 一 一 个 关联 到 Access 组 合 框 的 事件 , 当 用 户 输入 不 在 列表 中 的 值 时 就 会 触发 它 。 
常用 于 给 表 中 添加 新 数据 ， 例 如 新 客户 。 

NULL 一 一 缺失 (或 当前 未 指定 ) 的 值 。 

object， 对 象 一 一 类 的 实例 或 特别 范例 。 例 如 ， 在 Employee (雇员 ) 类 中 ， 一 个 单独 的 雇 
员 就 是 一 个 对 象 。 在 关系 环境 中 ， 类 存在 表 中 ， 表 中 一 个 独立 的 行 就 是 一 个 对 象 的 数据 。 

object browser: 对 象 浏览 器 一 一 微软 提供 的 用 来 显示 可 用 的 对 象 属 性 和 对 象 方法 的 工具 。 

object-oriented (OO) database management system (OODBMS) : 面向 对 象 的 数 
据 库 管 理 系统 一 一 保存 对 象 (包括 属性 和 方法 ) 的 数据 库 系 统 ， 支 持 对 象 之 间 的 联系 ， 包 括 
继承 。 

object-oriented programming: 面向 对 象 编程 一 一 一 种 把 代码 封装 在 不 同 对 象 〈 或 类 ) 
定义 内 部 的 编程 方法 。 系 统 由 〈 有 和 希望 ) 可 重用 的 对 象 构建 起 来 ， 通 过 操纵 对 象 属性 和 调用 
对 象 方法 来 控制 系统 。 

online analytical processing (OLAP) : 联机 分 析 处 理 一 一 用 数据 库 来 做 数据 分 析 ， 其 关 
键 是 数据 的 提取 。 主 要 目标 是 提供 可 接受 的 响应 时 间 、 维 护 安全 以 及 方便 用 户 找 到 他 们 所 需 
的 数据 。 

online transaction processing (OLTP) ， 联机 事务 处 理 一 一 用 数据 库 来 完成 事务 处 理 。 
它 包括 很 多 插入 和 更 新 操作 ， 并 支持 数 百 的 并 发 访问 。 数 据 的 高 速 存 储 、 可 靠 性 以 及 数据 的 
完整 性 都 是 主要 目标 。 具 体 的 实例 包括 航班 预定 、 在 线 银行 和 零售 。 

open database connectivity (ODBC ) :开放 式 数据 库 互 连 一 一 微软 提出 的 标准 ， 旨 在 使 
软件 可 以 访问 不 同 的 数据 库 。 每 个 DBMS 厂 商都 提供 OPDBC 驱 动 程序 。 要 更 换 PBMS ， 只 需 安装 
并 设置 合适 的 ODBC 驱 动 程序 ， 而 应 用 代码 只 需要 编写 一 次 即 可 。 

optimistic lock: 乐观 锁 一 一 不 阻塞 其 他 进程 的 事务 锁 。 如 果 数 据 在 读 、 写 操作 之 间 被 更 
改 ， 系 统 就 会 产生 一 个 必须 由 代码 处 理 的 错误 。 

option button ， 单 选 按钮 一 一 用 于 指示 选择 的 圆 形 按钮 。 按 照 设计 向 导 ， 单 选 按钮 表示 
相互 排斥 的 选择 ， 这 与 选择 框 不 同 。 

ORDER BY 一 一 SQL SELECT 语 多 里 的 子 句 ， 用 来 将 数据 列 排 序 输 出 。 修 饰 符 ASC 和 
DESC 用 于 指定 是 升序 还 是 降序 排列 。 

OUTER JOIN 一 一 代表 左 连接 和 右 连接 的 概括 性 术语 。 它 从 表 中 返回 行 ， 即 使 另 一 张 表 
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中 没有 匹配 的 行 。 
pack: 压缩 整理 一 一 必须 定期 在 数据 库 上 执行 的 维护 操作 ， 它 移 去 已 删除 数据 的 片断 。 


package: 包 一 一 UML 中 把 逻辑 元 素 分 成 一 组 的 机 制 ， 在 隔离 设计 组 件 时 很 有 用 。 包 可 
以 提供 整个 系统 的 全 局 视图 ， 而 不 需要 看 到 所 有 的 细节 。 

page footer: 页 脚 一 一 出 现在 每 页 底 端 的 报表 元 素 ， 常 用 作 页 码 。 

page header: 页 眉 一 一 出 现在 每 页 顶端 的 报表 元 素 ， 常 用 作 列 标题 和 子 标题 。 

parameter: 参数 一 一 传递 给 函数 或 子 例 程 并 在 计算 中 使 用 的 变量 。 

pass-by-reference: 传 址 一 一 可 以 在 子 例 程 内 部 修改 的 子 例 程 参数 。 如 果 它 被 修改 了 ， 
新 值 就 会 返回 给 调用 程序 。 也 就 是 说 ， 子 例 程 可 以 在 代码 的 其 他 部 分 修改 变量 。 通 常 这 是 危 
险 的 做 法 。 参 见 pass-by-value。 

pass-by-value: 传 值 一 一 不 能 在 子 例 程 内 部 修改 的 子 例 程 参数 ， 只 传递 了 它 的 值 。 如 果 
子 例 程 改变 该 值 ， 调 用 程序 中 的 初始 值 也 不 会 改变 。 

pass-through query: 直通 查询 一 一 前 端 被 Access 忽 略 的 SQL 查询 。 它 们 可 以 让 你 编写 针 
对 特定 服务 器 数据 库 的 复杂 SQL 查询 。 

persistent objects: 持久 对 象 一 一 面向 对 象 编 程 中 ， 一 种 存储 对 象 (文件 或 数据 库 中 ) 
市 后 还 能 把 数据 提取 出 来 的 能 力 。 

persistent stored modules (PSM); 持久 存储 模块 一 一 SQL-99 中 ， 一 种 把 方法 和 对 象 联 
起 来 存储 的 做 法 。 模 块 代码 将 由 DBMS 自 动 存储 和 提取 。 

pessimistic lock: 悲观 锁 一 一 从 开始 读 取 锁定 的 数据 到 事务 结束 前 都 阻塞 其 他 进程 的 完 
全 隔离 级 别 。 如 果 数 据 元 素 被 锁定 ， 程 序 代 码 将 会 接收 到 一 个 错误 消息 。 

physical security; 物理 安全 一 一 涉及 物理 性 地 保护 设备 和 人 员 的 安全 性 分 支 。 它 包括 灾 
难 应 急 计划 、 设 备 的 物理 访问 以 及 风险 分 析 和 防范 。 

pivot table: 主 元 表 一 一 微软 给 经 理 们 动态 检查 OLAP 数 据 的 工具 ， 典 型 情况 是 在 Excel 电 
子 数据 表 的 内 部 。 数 据 从 数据 库 或 OLAP 立 方 体 中 抽取 出 来 ， 然 后 经 理 们 可 以 点 击 按钮 来 检查 
得 和 或 详细 数据 。 

pointer: 指针 一 一 数据 的 逻辑 地 址 或 物理 地 址 。 

polymorphism: 多 态 性 一 一 在 类 的 层次 结构 中 ， 每 个 新 类 都 从 上 层 类 中 继承 方法 。 通 过 
多 态 性 ， 你 可 以 重 载 那些 定义 ， 并 给 新 类 指定 新 的 方法 (用 同样 的 名 字 )。 

primary key， 主 码 一 一 表 中 标识 特殊 数据 行 的 列 或 列 集 。 

private key: 私 钥 一 一 指 双 钥 加密 系统 中 不 透露 给 其 他 任何 人 的 密 钥 。 用 公 角 加密 的 消息 
只 能 用 匹配 的 私 钥 解 开 。 

procedural language: 过 程 语言 一 一 一 种 基于 过 程 的 传统 编程 语言 ， 一 般 情况 是 一 次 执 
行 一 条 语句 。 可 以 和 命令 直接 作用 到 数据 集 上 的 SQL 做 个 对 比 。 

procedure: 过 程 一 一 设计 来 执行 某 特定 任务 的 子 例 程 或 函数 ， 通 常 保 持 过 程 短 小 是 比较 
明智 的 。 

property: 属性 一 一 我 们 希望 跟踪 的 实体 的 属性 或 特征 , 这 个 术语 常用 于 面向 对 象 环境 中 。 
参见 attribute。 


prototype : 原型 一 一 应 用 的 最 初 轮廓 ， 快 速 构建 起 来 用 于 演示 和 测试 应 用 的 不 同 特性 。 
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常用 来 帮助 用 户 进行 可 视 化 和 改善 表单 、 报 表 。 

public key: 公 钥 一 一 指 双 钥 加 密 系 统 中 公开 的 密 钥 ， 用 公 钥 加 密 的 消息 只 能 用 匹配 的 私 
钥 解 开 。 

query by example (QBE)， QBE 语 言 一 一 用 填 表 的 方法 设计 查询 。 从 一 个 列表 中 选择 表 
和 列 ， 并 为 条 件 和 排序 填空 。 它 相对 容易 使 用 ， 需 要 最 小 的 输入 技巧 ， 通 常 随 帮 助 系统 提供 ， 
对 初学 者 很 有 用 。 

rapid application development (RAD ) ,快速 应 用 开发 一 一 试图 通过 效率 和 过 程 交 琶 来 
缩短 开发 时 间 的 系统 设计 方法 学 。 

referential integrity: 参照 完整 性 一 一 数据 完整 性 约束 ， 数 据 值 已 经 在 基本 表 中 时 ， 该 数 
据 才 可 以 输入 到 外 码 列 中 。 例 如 ， 如 果 1173 这 个 客户 ID 不 在 客户 表 中 ， 那 么 操作 员 就 没 法 输 
和 1173 号 客户 的 订单 。 

reflexive association: 自 反 关联 一 一 一 个 类 返回 自身 的 关联 。 最 常见 于 商务 中 的 
Employee (雇员 ) 类 ， 因 为 某 些 雇员 是 另 一 些 雇员 的 经 理 。 

reflexive join: 自 反 连 接 一 一 当 表 通过 第 二 个 列 与 自己 连接 时 的 情形 。 例 如 ， 表 Employee 
(EmployeeID，...，ManagerID) 就 可 能 有 从 ManagerID 到 EmployeeID 的 连接 。 

relational database: 关系 数据 库 一 一 最 流行 的 DBMS 类 型 。 所 有 的 数据 都 存储 在 表 (有 
时 也 叫 关 系 ) 中 。 各 表 通 过 它们 所 持 的 数据 (例如 ， 通 过 码 值 ) 逻辑 地 联系 着 。 关 系数 据 库 
应 当 通 过 数据 规范 化 来 设计 。 

relationship ， 关 系 一 一 两 个 或 多 个 实体 之 间 的 关联 。 参 见 association 。 

repeating groups: 重复 组 一 一 重复 数据 的 组 ， 例 如 客户 购买 的 各 种 商品 ， 一 个 客户 的 多 
个 电话 号 码 以 及 分 配给 某 个 员工 的 各 项 任务 。 

replicate: 复制 一 一 制作 数据 库 的 一 个 良好 副本 ， 以 便 可 以 分 布 到 新 的 地 点 ， 然 后 迟 些 时 
候 由 主 拷贝 进行 数据 同步 。 

replication manager: 复制 管理 器 一 一 在 依赖 复制 的 分 布 式 数 据 库 中 ， 管 理 器 是 把 更 改 
传 给 数据 库 的 不 同 副本 的 自动 系统 。 如 果 两 个 人 在 复制 前 更 改 了 同一 份 数据 ， 它 就 必须 处 理 
这 些 冲 突 。 

report footer: 报表 尾 注 一 一 出 现在 报表 结尾 的 报表 元 素 ， 常 用 于 总 结 性 的 统计 或 图 表 。 

report header: 报表 标题 一 一 只 出 现在 报表 开头 的 报表 元 素 ， 常 用 于 标题 页 和 概览 。 

report writer: 报表 编写 器 让 你 在 屏幕 上 建立 报表 来 指定 各 项 如 何 显示 及 计算 的 
DBMS 工 具 。 这 些 任 务 中 的 大 多 数 都 通过 在 屏幕 上 拖 搜 数据 来 执行 。 

resume:， (VBA 语 句 ) 一 VBA 错误 处 理 语 句 ， 它 告诉 进程 返回 新 地 点 并 继续 评估 代码 。 
Resume 自 身 就 返回 到 导致 错误 的 行 ，Resume Next 返 回 到 错误 行 的 下 一 行 ， 而 Resume <label> 
则 把 处 理 控制 转 到 label 指 定 的 新 行 。 

REVOKE 一 一 SQL 命令 ， 用 来 删除 分 发 给 某 些 用 户 的 许可 。 

RIGHT JOIN 一 一 包含 “ 右 ” 表 所 有 行 (即使 “ 左 ” 表 中 没有 匹配 的 行 ) 的 OUTER JOIN， 
缺失 的 值 显示 为 Null。 参 见 LEFT JOIN 和 INNER JOIN。 左 表 和 右 表 是 按 表 的 列 出 顺序 定义 的 ， 
左 表 是 第 一 个 表 。 

Rivest-Shamir-Adeiman (RSA) encryption: RSA 加 密 一 一 一 种 由 三 名 数学 家 持 有 美国 
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专利 的 双 钼 加 密 系统 。 参 见 dual-key encrytion 。 

role: 角色 一 一 按 任务 或 角色 来 分 配 权限 的 安全 组 ， 用 它 替 代 分 配给 个 人 的 方案 。 角 色 使 
得 改变 雇员 权限 变 得 简单 多 了 。 

roll back: 回 滚 一 一 数据 库 系统 的 事务 特性 。 如 果 错 误 发 生 在 一 个 改变 序列 中 ， 前 面 的 改 
变 可 以 回 深 ， 然 后 用 正确 的 数据 将 数据 库 重 新 恢复 到 一 个 安全 状态 。 

roll forward:， 前 滚 一 一 如 果 在 处 理事 务 中 发 生 错 误 ， 数 据 库 可 以 重启 ， 并 从 一 个 已 知 的 
检查 点 进行 装载 。 然 后 部 分 完成 的 事务 可 以 前 深 到 中 断 的 记录 处 。 

roll up: 上 卷 一 一 聚集 细节 数据 到 按 类 别 总 计 显示 的 操作 ， 常 用 在 数据 仓库 或 OLAP 应 用 
中 检查 数据 。 参 见 drill down。 

row-by-row calculations， 逐 行 计 算 一 一 SQL 执行 内 联 计算 的 方式 。 例 如 ， 语 名 SELECT 
price * Quantity AS Extended 遍 历 每 一 行 ， 并 把 行 中 的 价格 值 和 对 应 的 数量 值 相 乘 得 出 计算 
结果 。 

schema: 模式 一 一 按 共同 目的 分 组 的 表 集 合 。 

scope; 作用 域 一 一 指 变量 在 哪里 可 以 被 访问 。 一 般 情况 下 ， 在 子 例 程 内 部 定义 的 变量 只 
能 被 那个 子 例 程 内 部 的 代码 访问 。 定 义 到 模块 内 的 变量 可 以 全 局 地 被 模块 内 的 任意 代码 访问 。 

scroll bars: 滚动 条 一 一 用 来 进行 水 平 或 垂直 移动 的 常见 的 图 形 界面 元 素 。 

second normal form (2NF)， 第 二 范式 一 一 如 果 每 个 非 码 列 都 依赖 于 整个 码 (不 只 是 码 
的 一 部 分 ) ， 这 个 表 就 属于 第 二 范式 。 这 个 问题 仅 当 有 连接 码 (多 列 ) 时 才 会 出 现 。 

SELECT 一 一 SQL 中 主要 的 数据 提取 命令 ， 其 主要 组 件 包 括 SELECT ... FROM ... INNER 
JOIN ... WHERE .…。 

self-join ， 自 连接 表 连 接 到 它 本 身 。 参 见 reflexive join 。 

serialization: 串 行 化 一 一 事务 要 求 ， 它 指定 每 个 事务 完全 独立 对 待 ， 就 好 像 没 有 其 他 事 
务 一 样 。 

shell site ，( 见 “ 冷 站 ”) 一 一 参见 cold site 。 

single-row form: 单行 表单 一 一 一 次 只 利用 表 中 一 行 显示 数据 的 输入 表单 ， 是 最 常见 的 
输入 表单 ， 因 为 设计 者 拥有 表单 布局 的 完全 控制 。 

snapshot: 快照 一 一 在 持续 变化 的 数据 库 中 ， 可 以 取 一 个 快照 来 得 到 数据 在 某 个 时 间 点 
的 一 份 副本 。 

snowflake design: 雪花 设计 一 一 用 于 OLAP 的 数据 库 设计 。 事 实 表 连 着 维 表 ， 维 表 可 以 
连接 其 他 维 表 。 比 星 形 设计 限制 得 要 宽松 。 

SQL 一 一 标准 化 的 数据 库 语言 ， 用 于 数据 提取 (查询 )、 数 据 定义 和 数据 操纵 。 

SQL 1999 (SQL 3) 一 一 SQL 1999 的 设计 很 大 程度 上 给 SQL 语言 增添 了 面向 对 象 的 特性 ， 
并 于 1999 年 通过 该 标准 。 

SQL 200x 一 一 一 个 几乎 已 经 完成 的 SQL 新 版 本 。 它 的 主要 贡献 是 把 XML 和 多 媒体 集成 到 
关系 数据 库 的 规范 化 定义 里 。 

star design; 星 形 设计 一 一 用 于 OLAP 的 数据 库 设 计 。 事 实 表 连 接着 提供 待 分 析 类 别 的 维 
表 。 比 雪花 设计 限制 更 多 一 些 ， 所 有 的 维 表 都 直接 连接 在 事实 表 上 。 

style sheet， 样式 表 一 一 描述 一 系列 网 页 所 需 布局 、 字 体 及 风格 的 特殊 文件 。 这 是 个 很 强 
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大 的 方法 ， 通 过 对 文件 进行 极 少 的 修改 就 能 建立 和 改变 许多 网 页 的 风格 。 

subform form: 子 表单 一 一 显示 在 另 一 个 ( 主 ) 表单 内 部 的 表单 。 子 表单 里 的 数据 通常 
连接 到 主 表 单 中 正在 显示 的 行 上 。 

subquery: 子 查询 一 一 在 主 查 询 内 部 使 用 第 二 个 查询 来 提取 额外 的 数据 。 例 如 ， 要 提取 
价格 比 平均 值 高 的 所 有 销售 数据 ，WHERE 子 句 可 以 使 用 一 个 子 查询 来 计算 平均 价格 。 

subroutine : 子 例 程 一 一 设计 来 执行 特定 任务 的 一 个 独立 的 代码 片断 。 子 例 程 可 以 使 用 
参数 和 调用 它 的 过 程 交 换 数 据 。 

subtable ， 子 表 一 一 在 SQL 1999 中 ， 子 表 从 基本 表 中 继承 所 有 的 列 。 它 提供 类 似 于 抽象 
数据 类 型 的 继承 ， 但 是 ， 所 有 的 数据 都 存放 在 独立 的 列 里 。 

Super-aggregate: 超 聚 集 一 一 查询 中 合计 的 合计 ， 是 OLAP 查 询 中 由 ROLL UP 选项 提供 
的 重要 概念 。 

support: 支持 度 一 一 关联 规则 中 的 数据 挖掘 的 度量 ， 由 包含 两 个 项 的 事务 的 百分比 计算 
得 到 。 

switchboard form ， 导 航 表单 一 一 用 于 指引 用 户 到 应 用 不 同 部 分 的 表单 ， 常 用 作 显 示 的 第 
一 个 表单 。 表 单 上 的 选项 应 该 匹配 用 户 的 各 项 任务 。 

synonym: 同义词 一 一 完全 数据 库 路 径 的 简短 名 字 。 短 名 字 的 优点 是 很 容易 记忆 ， 而 且 
用 户 不 需要 知道 数据 在 哪里 存放 。 另 外 ， 如 果 每 个 人 都 使 用 同义词 ， 数 据 库 管理 员 可 以 很 容 
易 地 把 服务 器 数据 库 转 移 到 不 同 地 点 ， 而 仅 需 修改 同义词 的 属性 。 

syntax: 语法 一 一 可 以 在 程序 中 创建 命令 的 特定 格式 。 程 序 包 括 逻 辑 步骤 ， 但 每 个 命令 必 
须 按 特定 的 格式 给 出 ， 以 便 编译 器 理解 。 编 译 器 通常 要 检查 语法 并 进行 消息 提示 。 

tab order. Tab 硕 序 一 一 用 户 按 Tab 键 或 Return 键 时 表单 上 控件 的 跟随 次 序 。 

table: 表 一 一 一 个 类 或 实体 的 数据 集合 ， 每 个 属性 包含 很 多 列 ， 并 且 在 每 行 保存 一 个 实体 
或 对 象 的 数据 。 

tablespace: 表 空 间 一 一 Oracle 中 ， 表 空间 是 分 配 来 保存 表 、 索 引 和 其 他 系统 数据 的 磁盘 
空间 。 必 须 首 先知 道 数 据 库 的 大 致 大 小 。 

tabular form : 表格 表单 一 一 在 列 和 行 显示 数据 的 输入 表单 。 当 没有 几 列 数据 或 者 用 户 需 
要 同时 看 到 多 行 时 比较 有 用 。 

third normal form (3NF) : 第 三 范式 一 一 如 果 每 一 个 非 码 列 都 依赖 于 整个 码 (而 没有 其 
他 码 ) ， 表 就 满足 第 三 范式 。 

three-tier client/server: 三 层 客 户 端 /服务 器 一 一 含有 中 间 层 的 客户 端 /服务 器 系统 ， 中 间 
层 保存 着 定义 商业 规则 和 加 强 对 不 同事 务 服务 器 访问 能 力 的 代码 。 

toggle button : 切换 按钮 一 一 选择 框 的 一 个 三 维 变型 ， 用 来 指示 一 个 选项 。 

toolbar: 工具 栏 一 一 应 用 里 保存 按钮 和 文本 菜单 的 组 件 。 用 户 可 以 点 击 一 两 下 鼠标 来 执 
行 命令 。 用 来 保持 常用 的 命令 ， 以 及 用 于 整个 应 用 的 命令 ， 例 如 打印 。 

tooltip: 工具 提示 一 当 用 户 把 鼠标 指针 移 过 屏幕 上 一 项 时 显示 出 来 一 个 简短 消息 ， 对 于 
识别 图 标的 功能 非常 有 用 。 

TOP 一 一 Access 提 供 的 SQL SELECT 子 句 ， 用 来 限制 显示 输出 的 行 数 。 可 以 直接 设置 行 数 
或 用 总 行 的 百分比 来 表示 。 
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transaction : 事务 一 一 在 数据 库 应 用 中 ， 事 务 是 必须 一 起 完 行 的 一 系列 操作 。 事 务必 须 
由 DBMS 识 别 ， 然 后 提交 或 回 滚 (如 果 有 错误 )}。 例 如 ， 从 一 个 银行 账户 到 另 一 个 账户 的 转帐 
需要 对 数据 库 进行 两 个 更 改 ， 这 两 个 更 改 必须 同时 成 功 或 同时 失败 。 

transaction processing: 事务 处 理 一 一 为 记录 事务 而 收集 数据 。 常 见 的 例子 包括 销售 、 
人 力 资源 管理 以 及 金融 计算 。 

trigger: 触发 器 一 一 导致 一 个 过 程 执 行 的 事件 。 例 如 ， 点 击 按钮 可 以 是 一 个 触发 器 ， 一 
数据 值 的 改变 也 可 以 引起 触发 器 执行 。 

tuning: 调整 一 一 建立 索引 、 重 写 查 询 ， 并 设置 和 存储 其 他 参数 以 提高 数据 库 应 用 的 性 能 。 

two-phase commit， 两 阶段 提交 叶 问 题 的 机 制 。 
在 第 一 阶段 ， 协 调 的 DBMS 发 送 更 新 到 其 他 数据 库 并 让 它们 准备 这 个 事务 。 一 旦 它们 都 同意 ， 
协调 者 发 送 消息 来 提交 更 新 。 

unicode: 一 一 存储 和 显示 不 同 字符 集 的 标准 方法 。 当 今世 界 几 乎 所 有 的 字符 集 都 有 定义 ， 
还 包括 一 些 古 老 的 语言 。 它 使 用 2 个 字 节 表示 每 个 字符 ， 使 得 它 可 以 处 理 超过 65 000 个 字符 或 

Unified Modeling Language (UML); 统一 建 模 语言 一 一 设计 并 记录 计算 机 和 商务 系统 
的 标准 化 建 模 语 言 。 

UNION 一 一 从 两 个 SELECT 语句 中 合并 行 的 SQL 子 句 。 两 个 查询 必须 有 相同 数目 、 相 同 域 
的 列 。 大 多 数 系 统 也 支持 INTERSECT 和 EXCEPT (或 SUBTRACT) 操作 符 。 

UPDATE 一 一 SQL 数据 操纵 命令 ， 用 来 改变 特定 列 的 值 。WHERE 子 句 指定 哪些 行 
影响 。 

User Interface: 用 户 界面 一 一 用 户 看 到 应 用 时 的 外 观 和 感觉 。 图 形 化 界面 经 常 采用 ， 用 
户 可 以 在 屏幕 上 操纵 图 标 和 数据 来 执行 任务 。 

validation table; 确认 表 一 一 一 或 两 列 的 简单 表 ， 包 含 输入 其 他 表 的 标准 化 数据 。 例 如 ， 
一 个 部 门 的 列表 可 能 会 存储 在 确认 表 中 。 要 给 Employee 〈 雇 员 ) 表 中 输入 部 门 的 名 字 ， 用 户 
只 需 从 确认 表 中 选 出 那些 行 就 可 以 了 。 

VARCHAR 一 一 存储 字符 数据 的 一 种 常见 方法 ， 它 代表 可 变 的 字符 。 数 据 的 每 一 列 都 使 用 
谁 确 数目 的 字 节 ， 用 这 些 字 节 来 存储 特定 数据 。 

variable ， 变量 一 一 用 来 存储 临时 值 的 内 存 地 点 。 依 赖 于 在 哪里 创建 和 如 何 定义 ， 变 量 都 
有 作用 域 和 生命 期 。 它 们 也 有 特定 的 数据 类 型 ， 尽 管 VBA 中 的 Variant 数 据 类 型 可 以 匹配 任何 
常见 的 数据 类 型 。 

vertical partition， 垂直 划分 一 一 根据 数据 列 把 表 划 分 成 组 。 较 大 的 列 或 不 常用 的 列 【( 例 
如 图 片 ) 可 以 移 到 较 慢 、 也 更 便宜 的 存储 设备 中 。 

view: 视图 一 一 保存 的 查询 。 可 以 从 视图 中 创建 提取 数据 的 新 查询 。 视 图 保存 为 SQL 语句 ， 
而 不 是 实 实在 在 的 数据 。 

Visual Basic (VB) :， Visual Basic 语 言 一 一 一 种 微软 出 售 的 独立 的 程序 设计 语言 ， 用 来 
在 Windows 环 境 中 开发 应 用 。 其 专业 版 支持 数据 库 连 接 。 它 的 程序 可 以 编译 成 独立 的 可 执行 
文件 。 

Visual Basic for Application (VBA) : VB 应 用 一 一 能 用 于 几乎 所 有 微软 工具 (包括 








